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La presente invention se rapporte a un fragment 
nucleique endogene de type r6troviral integre a I'ADN du 
genome humain. 

Les retrovirus sont des virus a ARN qui se 
r6pliquent par un processus dit de transcription inverse, 
mgdiS par une ADN polymerase ARN d^pendante dSnommSe 
reverse transcriptase (RT) , cod6e par le g6ne pol. L'ARN 
retroviral comprend 6ga lament au moins deux genes 
additionnels qui sont les g^nes gag et env. Le g^ne gag 
code pour les prot6ines du squelette, c'est A dire pour la 
matrice, la capside et la nucl§ocapside. Le gene env code 
pour les proteines d'enveloppe. La transcription est 
r^guiee par des regions promotrices situees au niveau des 
LTR {Long Terminal Repeat) encadrant les extremitfes 5' et 
3' terminales du genome retroviral ♦ 

Au cours de 1' evolution les humains ou leurs 
ancetres ont integr6 dans leur genome du materiel 
d'origine r6trovirale suite ^ une infection. En effet, 
lors de 1' infection d'une cellule/ la reverse 
transcriptase fait une copie ADN de I'ARN retroviral, 
cette copie d'ADN pouvant alors eventuellement s'intSgrer 
dans le g6nome humain. Les retrovirus peuvent infecter les 
cellules germinales et se transmettre ainsi aux 
generations futures par transmission Mendeiienne 
verticale. On parle alors de retrovirus endogenes qui sont 
presents sous la forme d'ADN proviral integr6 dans le 
genome de toutes les cellules humaines. La plupart des 
retrovirus endogenes sont silencieux ou defectifs. 
Toutefois certains d'entre eux ont pu conserver tout ou 
partie de leurs proprietes initiales et peuvent etre 
actives dans des conditions particulieres. L' expression 
des retrovirus endogenes peut aller de la transcription de 
genes viraux jusqu'i la production de particules virales. 

Ces retrovirus endogenes peuvent §tre associ6s 
directement ou indirectement au developpement de certaines 
pathologies . 
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Des structures r^troviraies endogenes peuvent se 
retrouver sous une forme complete LTR-gag-pol-env-LTR ou 
sous des formes tronqu6es. 

Ainsi/ dans une pr6c6dente demande de brevet 
5 {PCT/FR98/01442) / la Demanderesse a criblfe une banque 
d'ADNc ^ I'aide d'une sonde Ppol-MSRV (SEQ ID NO: 18) et 
dStect§ des clones chevauchants qui lui ont permis de 
reconstruire un ARN g§nomique putatlf de 7582 nucleotides. 
Get ARN genomique presente une structure R-U5-gag-pol-env- 

10 U3-R. Une interrogation « blastn » sur plusieurs bases de 
donn6es a I'aide du genome reconstruit a permis de montrer 
qu'il existe une quantity importante de sequences 
gSnomiques (ADN) apparentSes dans le g§nome humain qui 
sont trouv^es sur plusieurs chromosomes. Ainsi, la 

15 Demanderesse a mis en Evidence 1' existence de structures 
partielles de type retroviral dans le g6nome humain et 
envisage leur role potentiel dans le dSveloppement de 
maladies auto-immuneS/ dans des insuccds de grossesse ou 
des etats de grossesse pathologiques . 

20 A titre d'exemple on peut citer comme maladie 

auto-immune la sclerose en plaques, la polyarthrite 
rhimatolde, le lupus 6ryth6mateux diss6min6/ le diab^te 
insulino-dfependant et/ou les pathologies qui leur sont 
associSes. 

25 L'isolement et le s^quengage de fragments d'ADNc 

chevauchants et 1' identification de clones g^nomiques 
(ADN) correspondant aux clones d'ADN isol6s, dScrits dans 
la demande de brevet PCT prScit^e de la Demanderesse sont 
incorpores ici ^ titre de r6f6rence, 

30 Isolement et s§quengage de fragments d'ADNc 

chevauchants : 

Les informations concernant 1 'organisation de -la 
nouvelle f ami lie de r^rovirus endogenes d^nommee par la 
Demanderesse HERV-W ont et§ obtenues en testant une banque 

35 d'ADNc placentaire (Clontech cat#HL5014a) avec les sondes 
Ppol-MSRV (SEQ ID NO: 18) et Penv-C15 (SEQ ID NO: 19) et en 
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pratiquant ensuite une technique de "gene walking" d 
I'aide des nouvelles sequences obtenues. Les experiences 
ont 6t6 mises en oeuvre en se r^ferant aux preconisations 
du fournisseur de la banque. Des amplifications PGR sur 
5 ADN ont Sgalement 6t6 exploitSes pour comprendre cette 
organisation* 

Les clones suivants ont ete selectionn§s et 
sSquencSs : 

- Clone C1.6A2 (SEQ ID NO: 20) : region 5' non 
10 traduite de HERV-W et une partie de gag 

- Clone C1.6A1 (SEQ ID N0:21) : gag et une partie 

de pol 

• Clone C1.7A16 (SEQ ID N0:22): Region 3' de pol 

- Clone cl.Pi22 (SEQ ID NO: 23): r6gion 3' de pol 
IS et d6but de env 

- Clone cl.24.4 (SEQ ID N0:24) : ARN 6piss6 
comprenant une partie de la region 5' non traduite de 
HERV-W, la fin de pol et la r6gion 5' de env 

- Clone C1.C4C5. (SEQ ID NO: 25] : fin de env et 
20 region 3' non traduite de HERV-W 

- Clone C1.PH74 (SEQ ID NO: 26) : ARN sous- 
gSnomique : region 5' non traduite de HERV-W, fin de pol, 
env, et region 3' non traduite de HERV-W 

- Clone C1.PH7 (SEQ ID NO: 27) : ARN multi-episs6 
25 : region 5' non traduite de HERV-W, fin de env et region 

3' non traduite de HERV-W. 

- Clone cl.PiST (SEQ ID N0:28) : gSne pol partiel 
et region U3-R 

- Clone cl.44.4 (SEQ ID NO: 29) : region R-U5, 
30 g6ne gag et gene pol partiel. 

A I'aide de ces clones, en procedant i des 
alignesients de sequences, un module de sequence totale de 
HERV-W a 6t6 61abor6. Les ARN fepisses ont 6t6 mis en 
Evidence ainsi que les sites potentiels donneurs et 
35 accepteurs d'6pissage. Par 6tude de similitude avec des 
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retrovirus existantS/ les entites LTR, gag, pol et env ont 
St§ dSfinies. 

L' organisation genet ique putative de HERV-W sous 
forme ARN est la suivante (SEQ ID NO: 30): 
5 gdne 1..7582 

Localisation des clones' sur la sequence ARN gSnomlque 
reconstruite 

C1.6A2 (1321 pb) 1-1325 ; 

C1.PH74 (535+2229= 2764 pb) 72-606 et 5353- 
10 7582; 

cl.24.4 (491+1457= 1948 pb) ; 115-606 et 5353- 
6810; 

cl.44.4 (2372 pb) 115-2496 ; 

C1.PH7 (369+297= 666pb) 237-606 et 7017-7313; 
15 C1.6A1 (2938 pb) 586-3559.; 

cl.Pi5T (2785+566= 3351 pb) 2747-5557 et 7017- 
7582; 

C1.7A16 (1422 pb) 2908-4337; 
cl.Pi22 (317+1689 = 2006 pb) 3957-4273 et 
20 4476-6168; 

C1.C4C5 (1116 pb) 6467-7582 
5'LTR 1..120 

/note="R of 5'LTR (extremite 5' 
incertaine" 
25 121. ,575 

/note="U5 of 5'LTR" 
divers 57 9 ,.596 

/note="PBS primer binding site pour tRNA- 
W" 

30 divers 606 

/note=" jonction d'6pissage (site donneur 
d'6pissage ATCCAAAGTG-GTGAGTAATA et site 
accepteur d'^pissage CTTTTTTCAG-ATGGGAAACG 
clone RG083M05, GenBank accession 

35 AC000064)" 
divers 5353 
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divers 
5 ORF 

divers 
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ORF 



ORF 
IS divers 
3'LTR 

20 divers 



/note="site accepteur d'6pissage pour 

I'ORFl (env)" 

5560 

/note=''site donneur d'epissage" 
5581. ,7194 

/note="ORFl env 538 AA" 
/pr odui t " enve loppe " 
7017 

/note="site accepteur d'epissage pour 0RF2 

et 0RF3" 

7039. ,7194 

/note="0RF2 52 AA" 

7112.. 7255 

/note«"0RF3 48 AA" 

7244. .7254 

/note="PPT polypurine tract" 
7256.. 7582 

/note-="U3-R of 3' LTR (jonctxon U3-R 

indStermin^e) 

7563.. 7569 

signal de polyad^nylation 



Identification de clones gfenomiques (ADN) 
correspondant aux clones d'ADN isol6s : 

25 Une interrogation "blastn" sur plusieurs bases de 

donn§es, k l*aide du genome reconstruit, a iaontr6 qu'il 
existe une quantite importante de sequences apparent^es 
dans le genome huitiain. Environ 400 sequences ont 6te 
identifi6es dans GenBank et plus de 200 sequences dans la 

30 banque EST, la plupart en anti-sens. Les 4 sequences les 
plus significatives en taille et en similitude sont les 
sequences des clones g^nomiques (ADN) suivants : 

le clone humain RG083M05 (gb AC000064) dont la 
localisation chromosomique est 7q21-7q22/ 
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le clone humain BAC378 (gb U85196^ gb AE000660) 
correspondant au locus alpha delta du rScepteur des 
cellules T, localise en 14qll-12, 

le cosmide humain Q11M15 (gb AF045450) 
5 correspondant ^ la region 21q22*3 du chromosome 21, 

le cosmide U134E6 (embl Z838S0) sur le chromosome 

Xq22. 

La localisation des regions alignees pour chacun 
des clones est indiqu6e et I'appartenance a un chromosome 

10 est indiqu6e entre crochets (figure 6) • Le pourcentage de 
similitude (sans les larges delations) entre les 4 
sequences et I'ARN g^nomique reconstruit est indiqu§, 
ainsi que la presence de sequences r6p§t6es d. chaque 
extr§mit6 du g§nome et la taille des plus grandes trames 

15 de lecture (ORF) . Des sequences rSpStSes ont 6t6 trouv^es 
aux extremitfes de 3 de ces clones . La sequence 
reconstruite est contenue integralement a I'int^rieur du 
clone RG083M05 (9^6 Kb) et presente une similitude de 96%. 
Cependant le clone RG083M05 presente une insertion de 2 Kb 

20 situ^e immfediatement en aval de la region 5' non traduite 
(5' UTR) . Cette insertion est ^galement trouvee dans deux 
autres clones g^nomiques qui presentent une d616tion de 
2/3 Kb immfediatement en amont de la region 3* non traduite 
(3* UTR). Aucun clone ne contenait les trois trames de 

25 lecture (ORFs) gag, pol et env fonctionnelles. Le clone 
RG083M05 montre une ORF de 538 acides amines (AA) 
correspondant & une enveloppe entiSre. Le cosmide Q11M15 
contient deux grandes ORFs contigties de 413 AA (trame 0) 
et 305 AA (trame +1) correspondant a une polyprotfeine pol 

30 tronqu6e . 

On a maintenant trouv6 et isol6 un fragment 
nucl6ique endog^ne, int^gre a I'ADN du genome humain, qui 
comprend ou consiste en au moins une partie du gene gag 
d'un retrovirus endogdne associ^ & une maladie auto- 
35 immune, ou d des insuccSs de grossesse ou pathologies de 
la grossesse, cette partie au moins codant, directement ou 
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indirecteinent/ pour un produit d' expression. Bien entendu, 
1' invention comprend Sgalement le complSmentaire dudit 
fragment . 

Avantageusement/ le fragment precedemment defini 
5 rfepond en outre a au moins I'une quelconque des 
caract6ristiques suivantes : 

il comprend/ ou consiste en, ledit gene gag 

entier ; 

ladite partie du fragment au moins code pour la 
10 matrice et la capside ; 

il comprend, ou consiste en, SEQ ID N0:1, 
SEQ ID NO: 2/ SEQ ID NO: 3, ou le complementaire de I'une 
quelconque desdites sequences ; 

il est localise sur au moins I'un des chromosomes 
15 humain 1, 3, 6, 1 et 16, de prSfSrence il est localise au 
moins sur le chromosome 3 ; 

le produit d' expression de ladite partie est de 
I'ARN messager ; 

le produit d' expression de ladite partie est 
20 immunologiquement reconnu par des anticorps presents dans 
un 6chantillon biologique d'un patient attaint d'une 
maladie auto-immune, telle que la sclerose en plaques ; de 
pr6f6rehce, le fluide biologique est choisi panni le 
s6rum, le plasma, le liquide synovial et 1' urine. 
25 Un autre objet de 1' invention est un produit de 

transcription endog^ne, ^ I'^tat isol6, susceptible d'§tre 
obtenu par transcription d'au moins ladite partie du gfene 
gag d'un fragment de 1' invention. 

L' invention concerne aussi un proc6de de 
30 detection de sequences nucl6otidiques endog^nes 
appartenant S un fragment de 1' invention comprenant les 
6tapes suivantes : 

on effectue au prfealable une 6tape d' extraction 
de I'ADN cellulaire d'un tissu ou fluide biologique, on 
35 realise au moins un cycle d' amplification de I'ADN 
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cellulaire/ telle que par PGR, au moyen d' amorces 
notamment choisies parmi SEQ ID NO: 4 a SEQ ID NO: 9 et SEQ 
ID NO : 12 a SEQ ID NO ill, 

on met en contact I'ADN cellulaire present dans 
5 l'6chantillon avec une sonde dfeterminfee susceptible de 
s'hybrider avec un fragment tel que d6fini precSdemment et 
de former un complexe d' hybridation/ ladite sonde 
comprenant au moins 15 nucleotides, de preference 17 et 
avantageusement 19 nucleotides contigus de SEQ ID NO :3 ou 

10 consistant en SEQ ID NO :3, dans des conditions 
appropri^es permettant 1' hybridation, en particulier dans 
des conditions de forte stringence, et 

on detecte les complexes d' hybridation formes par 
tout moyen approprie. 

15 Avantageusement, la sonde est marquee par un 

traceur, tel que par exemple un traceur radioactif ou une 
enzyme. 

L' invention concerne aussi un precede de 
detection de sequences nucleotidiques endoggnes 
20 appartenant i. un fragment de 1' invention coic^renant les 
etapes suivantes : 

on effectue au pr^alable une 6tape d' extraction 
de I'ADN cellulaire d'un tissu ou fluide biologique, on 
realise au moins un cycle d'an^lif ication de I'ADN 
25 cellulaire, telle que par PCR, au moyen d' amorces 
notamment choisies parmi SEQ ID NO: 4 k SEQ ID NO: 9 et SEQ 
ID NO :12 ^ SEQ ID NO :17, 

on effectue une etape de transcription / 
traduction in vitro du produit amplifie, et 
30 on fait reagir le produit issu de I'etape de 

transcription / traduction avec un serum ou plasma d'un 
patient presentant une maladie auto-immune. 

L' invention concerne encore un proc6d6 pour 
1' etude et/ou le suivi d'une proliferation cellulaire des 
35 cellules T in vitro selon lequel on met en contact les 
cellules T d'un patient avec soit des produits de 
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transcription / traduction (SEQ ID NO :31), tels 
qu'obtenus selon le proc^d^ ci-dessus, soit des peptides 
de synthase d6riv6s de ou appartenant i SEQ ID NO :31. 

Un autre objet de 1' invention est un proc6d6 de 
5 marquage inol6culaire in situ de chromosomes isoles de 
patients dans lequel on utilise une sonde marquee, par 
tout traceur approprie, comprenant tout ou partie de SEQ 
ID NO :3, 

L' invention concerne aussi : 
10 Une proteine recombinante obtenue & partir d'une 

cassette d' expression dans un hote bacterien caracteris^e 
en ce que sa sequence prot^ique consiste en SEQ io 
NO :31 ; en particulier I'hdte bact6rien est £. coii. 

Un rSactif pour la detection d'une maladie auto- 
15 immune ou un suivi de grossesse comprenant au moins un 
fragment ou une proteine de 1' invention ; 

L' utilisation d'un fragment ou d'une proteine de 
1' invention pour d§tecter, dans un echantillon biologique, 
une susceptibility a une maladie auto-immune ou un suivi 
20 de grossesse ; en particulier, la maladie auto-immune est 
la sclerose en plaques. 

Avant d'exposer la prfesente invention plus en 
detail, la definition de certains tennes employes dans la 
description et les revendications est donn§e. 
25 L' expression « produit d' expression » signifie 

tout produit d6riv6 de I'ADN retroviral int6gr6 dans le 
genome humain incluant les produits de la transcription 
(ARN messager) et les produits issus de la traduction de 
I'ARN messager obtenu. Dans ce dernier cas, et & titre 
30 d'exemple, le produit peut §tre un peptide / une protfeine 
fonctionnelle ou fonctionnalisable/ c'est-a-dire 
susceptible de devenir fonctionnelle. 

Par partie codant, directement ou indirectement, 
pour un produit d' expression, on entend une partie qui a 
35 elle seule comprend au moins tout ou partie d'un cadre de 
lecture ouvert duquel on peut d^duire une sequence 



10 



d'acides amines, et dont la capacite codante peut etre i 
induite par des 616ments tels que par exemple ceux , 
susceptibles d' avoir une activity promotrice. Cette 

i 

definition inclut la variability qui peut €tre retrouv6e 
5 dans la sequence nuclSique codante^ sous reserve que les j 
conditions ci-dessus soient respect6es. 

I 

; 

Exenple 1: Localisation du gene gag de la famille 

I 

HERV-W sur les chromosomes humains par la technique de j 
10 Southern blot ! 

Afin de localiser le gene gag de la famille 1 
HERV-Wr une sonde correspondante t ce* g6ne de MSRV a 6t6 1 | 
hybrid6e sur une membrane de Nylon (Hybond* N+, Amersham) I 
contenant 5 pg d'ADN de 24 hybrides somatique de cellules 
15 Ihumain x rongeurs] (de I'ADN g^nomique humain isole: 22 , 
chromosomes autosomes et 2 chromosomes sexuels) et 3 ADN • 
contrSles (humain, souris et hamster) dig6res par 1' enzyme 1 
de restriction EcoRI. 

La sonde utilis^e est la suivante : Pgag-C12 \ 
20 identifi^e par SEQ ID NO: 3 correspondant d la region 
codante (de 1056 pb) du clone MSRV gag C12. 

1,1- Obtention du clone 2, C12, contenant en 
3' une partie homologue au g^ne pol, correspondant au gene 

25 protease, et une partie homologue au gdne gag { 
correspondant & la nucl4ocapside et une region 5' codante, 
correspondant au gene gag, plus spScifiquement la xnatrice 
et la capside de MSRV-1. 

Une amplification par PGR a 6te effectufee sur de 

30 I'ARN total extrait ^ partir de 100 ul de plasma d'un 
patient atteint de SEP. Un t6moin eau, traits dans les 
memes conditions, a et6 utilise comme controle negatif. La 
synthese de cDNA a 6t§ r^alis^e avec 300 pmoles d'une 
amorce al6atoire (Gibco-BRL, France) et la transcriptase 

35 inverse « Expand RT » (Boehringer Mannheim, France) selon 
les conditions pr6conisees par la soci6t6. Une 
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amplification par PGR (polymerase chain reaction) a §t6 
effectu6e avec 1' enzyme Tag polymerase (Perkin Elmer, 
France) en utilisant 10 pi de cDNA dans les conditions 
suivantes : 94'*C 2 min, SS^'C 1 min, 72*^0 2 min puis 94**C 
1 min, 55*C 1 min, 72*^0 2 min pendant 30 cycles et 72**C 
pendant 7 min et avec un volume rfeactionnel final de 
50 pi. 

Les amorces utilisSes pour 1' amplification par 
PCR sont les suivantes : 

- amorce 5', identifi6e par SEQ ID N0:4 
5' CGG ACA TCC AAA GTG ATG GGA AAC G 3' ; 

- amorce 3', identifi6e par SEQ ID NO: 5 
5' GGA CAG GAA AGT AAG ACT GAG AAG GC 3' 

Une deuxi^me amplification par PCR dite 
« nich^e » a r6alis6e avec des amorces 3' et 5' 

situ§es i I'int^rieur de la region dej^ amplifiee. Cette 
deuxifeme PCR a 6t6 effectu6e dans les m§mGS conditions 
exp6rimentales que celles utilis6es lors de la premiere 
PCR, en utilisant 10 \xl du produit d' amplification issu de 
la premiere PCR. 

Les amorces utilis^es pour 1' amplification par 
PCR nich^e sont les suivantes : 

- amorce 5', identifiee par SEQ ID NO: 6 

5' CCT AGA ACG TAT TCT GGA GAA TTG GG 3' ; 

- amorce 3', identifi6e par SEQ ID NO: 7 
5' TGG CTC TCA ATG GTC AAA CAT ACC CG 3' 

Un produit d' amplification de 1511 pb a 6t6 
obtenu d partir de I'ARN extrait du plasma de patient SEP. 
Le fragment correspondant n'a pas 6t6 observ6 pour le 
temoin eau. Ce produit d' amplification a ete clon§ de la 
fagon suivante. 

L'ADN amplifie a ^t6 insert dans un plasmide i 
I'aide du kit TA Cloning®. Les 2 yl de solution d'ADN ont 
6te m§lang6s avec 5 pi d'eau distillee sterile, 1 pi d'un 
tampon de ligation 10 fois concentrfe « lOX Ligation 
Buffer », 2 pi de « PCR® Vector » (25 ng/ml) et 1 pi de 
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<K T4 DNA Ligase Ce melange a incubg une nuit i 

14*C. Les etapes suivantes ont ete realisees conformfement 
au instructions du kit TA Cloning® (Invitrogen) • Le 
melange de ligation a ete etale apres transformation de la 

5 ligation dans des bacteries E, coli. A la fin de la 
procedure, les colonies blanches de bacteries 
recombinantes ont ete repiqu6es pour etre cultiv6es et 
permettre 1' extraction des plasmides incorporfes selon la 
procedure dite de « minipr6paration d'ADN » (J. Sambrook, 

10 E.F . Fritsch and T. Maniatis, Molecular Cloning, a 
laboratory manual. Cold Spring Harbour Laboratory Press, 
1989) . La preparation de plasmide de chaque colonie 
recombinante a 6t6 coupee par 1' enzyme de restriction Eco 
RI et analysSe sur gel d* agarose* Les plasmides poss^dcuit 

15 un insert dStecte sous lumiere UV apr§s marquage du gel au 
bromure d'ethidium, ont 6te s61ectionn6s pour le 
sfequengage de 1* insert, aprSs hybridation avec une amorce 
compl§mentaire du promoteur T7 present sur le plasmide de 
clonage du TA cloning kit*. La reaction prealable au 

20 sdquencage a ensuite §te effectu^e selon la mSthode 
pr6conis6e pour 1 'utilisation du kit de sfequengage 
« Prism* Ready Reaction Amplitaq* FS, DyeDeoxy 
Terminator » (Applied Biosystems, ref • 402119) et le 
sequencage automatique a ete realist sur les appareils 373 

25 A et 377 Applied Biosystems, selon les instructions du 
f abricant . 

Le clone obtenu, denommfe C12, permet de d6finir 
une region de 1511 pb presentant une phase ouverte de 
lecture dans la region N-terminale de 1056 pb 
30 (SEQ ID NO: 3) codante pour 359 acides amines 
(SEQ ID NO: 31) correspondant aux regions matrice et 
capside du g^ne gag. 

La sequence nucl^otidique de C12 est identifiee 
par SEQ ID N0:1. Elle est representee ^ la figure 2 avec 
35 les trames de lecture potentielles en aminoacides. 
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1.2- Obtention de la sonde gag cl2 MSRV 
La sonde a ete obtenue apres amplification par 
PCR, k partir du plasmide pCR* vector (kit TA Cloning®/ 
Invitrogen) contenant 1' insert du clone: gag cl2 de MSRV, 
avec la Tag polymerase (Parkin Elmer, France) dans les 
conditions suivantes : 94*C 1 min, 55**C 1 min, 72*C 2 min 
pendant 35 cycles et 72 *C pendant 7 min et avec un volume 
rSactionnel final de 100 ]xl. 

Les amorces utilisees pour 1' amplification par 
PCR sont les suivantes : 

- amorce 5', identifi6e par SEQ ID NO: 12 
5'-CTA GAA CGT ATT CTG GAG AAT TGG GA-3' 

- amorce 3', identifi6e par SEQ ID NO: 13 
5'-CCT AAG GCA GAC TTT TGA AG -3' 

Un produit d* amplification de 1056 pb a 6te 
obtenu pour gag cl2 de MSRV, 

Aprds 1 'amplification par PCR, le fragment a 6t§ 
analyst en gel d' agarose 1%. Le fragment d^tecte sous 
lumiSre UV, aprds marquage du gel, au bromure d'^thidium, 
a 6t6 coupe et marque au [a-P^^] i I'aide des amorces 
aieatoires (Gibco-BRL, France) conformSment aux 
instructions du Jcit « Ready to go DNA labelling » 
(Pharmacia Biotech) . Les nucleotides non incorpor§s ont 
6t6 eiimines avec une colonne G-50 Quick Spin (Boehringer, 
Mannheim) • 

Southern blot 

Les conditions d' hybridation sont les suivantes : 
Apr^s 4 heures de pre-hybridation (en 5x SSC, IX 
Denhardt's, 0,1% SDS, 50% formamide, 20 mM Tris-HCl 
pH = 7,5, 0,1 mg/ml d'ADN de sperme de hareng) , la 
membrane de Nylon contenant les chromosomes humains a ete 
hybridfee (en 5x SSC, Ix Denhardt's, 0,1% SDS, 50% 
formamide, 20 mM Tris-HCl pH = 7,5, 0,1 mg/ml d'ADN de 
sperme de hareng, 5% sulfate de dextran) pendant 18 heures 
a 42*C, avec la sonde d'ADN de 1056 pb (SEQ ID NO: 3) de 
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gag cl2 marquee au P. Apres hybridation/ la membrane (The 
BIOS Monochromosomal Somatic Cell Hybrid blot, de Quantum 
Bioprobe) hybridee avec la sonde gag a 6t^ lavee en 
solution 2x SSC, 0,2% SDS 2 fois 15 min, a temperature 
5 ambiante, et (en 0,2x SSC - 0,2% SDS) 2 fois 15 min, k 
45**C. Apres lavage, la membrane a ete expos6e au film aux 
rayons X, d -80*C en presence d'6cran amplificateur . 

Les rSsultats sont presentes dans le tableau 1 

ci-apres . 
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Tableau 1 
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Exemple 2: ^Amplification par PGR du gene gag de 
la famille HERV-W sur chacun des chromosomes hximains 
isol6s ; verification de la specificite des amplifications 
par Southern blot ; test de transcription-traduction « in 
5 vitro » (PTT) k partir des produits de PGR, afin de 
verifier la capacity ' codante, reperer quels sont les 
chromosomes humains prSsentant des trames de lecture 
ouvertes pour le gene gag de la famille 

10 2.1- Amplification par PGR 

Pour 1' amplification du gene gag HERV-W/ une PGR 
a &te effectuSe sur chaque chromosome humain isolS INIGMS 
human/rodent somatic cell hybrid panel #2. The human 
monochromosomal NIGMS somatic hybrid mapping panel #2, 

15 dfecrit par H.L. Drwinga et all et B,L. Dubois et al) 
obtenu de Coriell Institute (Camden, NJ) ] avec 1' enzyme 
Tag polymerase (Perkin Elmer, France) en utilisant: 
40 pmol de chaque amorce, 25 mM de chaque dNTP 
(Pharmacia), 2,5 mM MgGlj/ 2,5 U de Tag polymerase dans le 

20 tampon PGR standard (Perkin Elmer), et 300 ng DWi de 
chromosome isol§ dans un volume final de 100 pi. Les 
conditions de PGR pour amplifier la region gag sont les 
suivantes : 3 min k 94 ''C; puis 1 min S 94 ''c, 1 min & 55®C, 
3 min 4 72*^0, pendant 30 cycles et 7 min a 72''C. 

25 Les amorces utilisfees pour 1' amplification, par 

PGR, du gSne gag i partir d'un ATG introduit dans la 
sequence gag HERV-W sur chaque chromosome humain isol6 
sont les suivantes : 

- amorce 5^, identifi6e par SEQ ID NO: 14 

30 S'-TTT GGT AAT AGG AGT GAG TAT AGG GGA GGG AGG ATG GGA AAG 
GTT GGG GGG GAG- 3' 

L' amorce contient la sequence du promoteur T7 RNA 
polymerase, un « spacer », la sequence Kozak (site 
d* initiation & la traduction chez les eucaryotes) et la 

35 s6quence 5' gag d partir de I'ATG de HERV-W. 

- amorce 3', identififee par SEQ ID NO: 15 
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5 • -TTTTTTTTTTTTTTTTTTTCAGGCTGCGCCAGTGTCCAGGAGAC-3 • 

L' amorce contient une queue de poly-A (pour 
stabiliser la transcription de I'ARN, representee par 18 
bases T) , un codon stop (repr^sente par TCA) et la 
sequence du g§ne protease (G+E+A) de MSRV-1. 

Pour 1' amplification du g^ne gag HERV-W en 
utilisant des oligonucleotides definis dans les regions 
LTR et protease de HERV-W avec 1' enzyme Tag polymerase 
(Perkin Elmer, France)/ les conditions de PGR ont ete les 
suivantes : 3 min k 94**C; puis 1 min a 94**C, 1 min k 60^*0, 
2 min a 72 35 cycles ; suivi de 7 min k 72**C/ avec 
50 ng de chaque ADN monochromosomal . 

Les amorces utilisees pour 1' amplification/ par 
PGR/ du gene gag a I'aide de 1' oligonucleotide defini dans 
la sequence LTR HERV-W sur chaque chromosome humain i50l6/ 
sont les suivantes : 

- amorce 5'/ identifiee par SEQ ID NO: 16 
5' -TGTCCGCTGTGCTCCTGATC-3' 

- amorce 3', identifiee par SEQ ID NO: 17 

5/ -TTTTTTTTTTTTTTTTTTTCAGGCTGCGCCAGTGTCCAGGAGAC-3 ' 

L* amorce contient une queue de poly-A (pour 

stabiliser la transcription de I'ARN, reprSsente par 18 

bases T), un codon stop (represente par TCA) et la 

sequence du gSne protease de G+E+A de MSRV-1. 

Les amplification par PGR ont ete effectuees dans 

I'appareil MJ Research PTC200/ Peltier Thermal cycler. Les 
produits de PGR (10 pi de chaque produit PGR) ont ete 
analyses dans un gel 1% agarose en TBE lX(Tris-HCl, 
borate, EDTA) . Afin de verifier la specif icite des 
produits d' amplification/ 3 pi de chaque produit PGR ont 
ete analyses en gel d'agarose et puis transferes sur ujie 
membrane de Nylon (Hybond*-N^/ Amersham) (Southern blot) a 
I'aide de NaOH 0/4N. L' hybridation avec la sonde gag cl2 

(1056 pb) (J. Sambrook et al, 1989) a ete effectuee dans 
les conditions suivantes : aprSs 4 heures de pre- 
hybridation (en 5x SSC/ IX Denhardt'S/ 0/1% SDS/ 50% 
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formamide, 20 mM Tris-HCl pH = 7,5, 0,1 mg/ml d'ADN de 
sperme de hareng), la membrane de Nylon a ete hybrid6e (en 
5x SSC, Ix Denhardt's, 0,1% SDS, 50% formamide, 20 mMTris- 
HCl pH = 7,5, 0,1 mg/ml d'ADN de sperme de hareng, 5% 
S sulfate de dextran) pendant 18 heurs a 42 ''C, avec la sonde 

32 

d'ADN gag marquee au P. Les produits de PGR gag de chaque 
chromosome humain isol6 ont 6t6 laves en solution de 2x 
SSC, 0,2% SDS 1 fois, 15 min a temperature ambiante; 0,2x 
SSC, 0,1% SDS 2 fois 15 rain chaque lavage a 65**C, en 0, Ix 

10 SSC, 0,1% SDS 2 fois 15 min chaque a Sb^'C, et en 0,lx SSC, 
0,1% SDS 2 fois 30 min chaque k temperature ambiante. 

Une partie du volume restant (4 pi) des produits 
d' amplification par PGR a 6t6 utilisfee pour le test de 
transcript ion- traduction « in vitro » PTT, (Roest PAM et 

15 al, 1993) (Promega, France) . Le volume restant a 6t6 
utilise pour le clonage dans le vecteur pCR® 2.1-TOPO 
(Invitrogen) conform6ment aux instructions du kit, et pour 
le sSquengage avec la methode pr^conisSe pour 
1' utilisation du kit de sfequengage « PRISM* Ready Reaction 

20 Amplitaq* FS, DyeDeoxy" Terminator » (Applied Biosystems, 
ref« 402119) et le s^quengage automatique a ete realise 
sur les appareils 373A et 377 Applied Biosystems, selon 
les instructions du fabricant. 

La partie codfee (SEQ ID NO: 31) par le fragment de 

25 2009 pb (SEQ ID NO: 2) a 6t6 amplifi6 par PGR avec 1' enzyme 
Pwo (SU/pl) (Boehringer Mannheim, France) en utilisant 1 pi 
de la mini-preparation de I'ADN du clone gag (SEQ ID 
NO :3) sous les conditions suivantes : 95**C 1 min, 60**C 1 
min, 72**C 2 min pendant 25 cycles et avec un volume 

30 reactionnel final de 50 |il S I'aide des amorces: 

- amorce 5' {Bam HI) (SEQ ID NO :8) : 

5» ATG GGA AAC GTT CCC CCC GAG 3' (21 mers), et 

- amorce 3' (Hind III), identifiee par SEQ ID N0:9 
5 GGC CTA AGG CAG ACT TTT GAA 3' (21 mers) 

35 
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Le fragment obtenu apr6s PGR, a 6t6 linearise par 
Bam HI et Hind III et sous-clonfe dans les vecteurs 
d' expression pET28C et pET21C (NOVAGEN) linearise par 
Bam HI et Hind III. Le sequencage de I'ADN du fragment de 
1089 pb dans les deux vecteurs d' expression a ete realise 
selon la methode preconis6e pour 1* utilisation du kit de 

TM 

sfequen^age "PRISM Ready Reaction Aniplitaq® FS, 
DyeDeoxy™ Terminator** (Applied Biosystems/ ref. 402119) 
et le sequengage automatique a 6t6 rSalisfe sur les 
appareils 373 A et 377 Applied Biosystems, selon les 
instructions du fabricant. 

L* expression de la sequence nucl§otidique du 
fragment de 1089 pb du clone gag par les vecteurs 
d' expression pET28C et pET21C sont identififees par 
respectivement SEQ ID N0:10 et SEQ ID NO: 11. 



2.2- Test de transcription-traduction « in 
vitro » (PTT, Promega) 

Ce test a 6t6 effectu6 pour rep§rer les 
chromosomes humains pr^sentant des trames de lecture 
ouvertes pour le gfene gag de la famille HERV-W. 

Dans un volume r6actiorinel de 25 pi, un melange 
contenant 12,5 ]il de lysat de reticulocyte de lapin TNT® 
(Promega), 1 pi de tampon de reaction TNT® (Promega), 
0,5 pi d'ARN polymerase TNT® (Promega), 0,5 pi de melange 
k ImM des acides amines moins methionine, 2 pi de 
"s-m6thionine (1.000 Ci/mmol) d 10 mCi/pl (Amersham) , 
0,5 pi d'inhibiteur de ribonucl^ase RNasin® & 40 U/pl/ 
4 yl de produits d' amplification par PCR (Equivalent 4 
1 pg) de chaque chromosome humain et 4 pi d'eau. Ce 
melange a 6t6 incube a 30 'C pendant 90 min* 

Les prot6ines gag correspondant aux produits de 
transcription/traduction du gene gag de la famille HERV-W 
de chaque chromosome humain, amplifi§ par PCR, ont 6t6 
mises en Evidence par ElectrophorEse sur gel de 
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polyacrylamide ^ 10% en presence de Dod§cyl Sulfate de 
Sodixim {SDS)-PAGE apres exposition du gel au film aux 
rayons X k temperature ambiante en presence d'^cran 
amplificateur. 

Les rSsultats sont pr^sent^s dans le tableau 2 

ci-apres. 
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Tableau 2 
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Exemple 3 : expression du clone gag chez 
Escherichia colx, et reaction avec des serums humains 

On a exprim6 la partie codante SEQ ID NO: 2 chez 
Escherichia coli puis" on a teste les produits ainsi 
5 exprimes vis i vis de sSrum de patients atteints de SEP, 
ainsi que de s6rum de patients sains. 

Les constructions pET28c-clone gag (1089 pb) et 
pET21C-clone gag (1089 pb) synthetisent/ dans la souche 
bacterienne BL21 (DE3), une prot6ine en fusion N- et C- 
10 terminale pour le vecteur pET28C et C-Terminale pour le 
vecteur pET2lC avec 6 residus histidine, de masse 
molfeculaire apparente d' environ 45 kDa, itiise en Evidence 
par 61ectrophor6se sur gel de polyacrylamide SDS-PAGE 
(U.K. Laenunli/ Cleavage of structural proteins during the 
15 assembly of the head of bacteriophage T4, Nature, 1970, 
227 : 680-685) . 

La reactivity de la prot6ine a ete mise en 
Evidence vis i vis d'un anticorps monoclonal anti- 
Histidine (DIANOVA) par la technique de Western blot 
20 (H. Towbin et al., Electrophoretic transfer of proteins 
from polyacrylamid gels to nitrocellulose sheets : 
procedure and some applications, Proc. Natl. Acad. Sci. 
USA., 1979, 76 :4350-4354). 

Les proteines recombinantes pET28c-clone gag 
25 (1089 pb) et pET21C-clone gag (1089 pb) ont 6te 
visualisees en SDS-PAGE dans la fraction insoluble apres 
digestion enzymatique des extraits bacteriens avec 50 \xl 
de lysozyme (10 mg/ml) et lyse par ultrasons. 

Les propri§t6s antigeniques des antigenes 
30 recombinants pET28C-clone gag (1089 pb) et pET21C-clone 
gag (1089 pb) ont ete testfees par Western Blot apr&s 
solubilisation du culot bactSrien avec 2% SDS et 50 mM 
P-mercapto6thanol . AprSs incubation avec les scrums de 
patients atteints de sclerose en plaques, les sSrxuns des 
35 t6moins neurologiques et les scrums de t6moins de centre 
de transfusion sanguine (CTS), les immunocomplexes ont 6te 
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detectfes i I'aide d'un s6ruin de chevre anti-IgG et anti- 
IgM humaines, couple a la phosphatase alcaline. 

Les resultats sont presentes dans le tableau 3 

ci-apr6s- 

Tableau 3 

R^activit^ de s§rums de patients atteints de sclerose en 
plaques et t^moins avec la proteine reconbinante de gag 
produite chez E. coii* 



MAIAOIE 


NOMBRC 


NOMBRE 




D'INDIVIDUS TESTfeS 


D'INDIVIDUS POSITIFS 


SEP 


15 


6 

2(+++), 2(++), 2(+) 


TEMOINS 






NEUROLOGIQUES 
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!(+++) 


TEMOINS 






SAINS (CTS) 
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1(+/-) 



(a) Les bandelettes contenant 1/5 \xg d*antig6ne 
recombinant gag prSsentent une rSactivit^ centre de scrums 
dilu6s au l/lOO, L' interpretation de Western Blot est 
basSe sur la presence ou absence d'une bande gag 
specif ique sur les bandelettes. Des contr61es positifs et 
n6gatifs sont inclus dans chaque experience - 

Ces resultats montrent que, dans les conditions 
techniques utilisees, environ 40% des serums humains 
atteints de sclerose en plaques testes r^agissent avec la 
proteine recoiabinante gag. 
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LZSTE DE SEQUENCES 

(1) IKK)BMATIOKS GEKERALES: 
(i) DEPOSANT: 
5 (A) Nm: BIOMERIEXnC 

(D) RUE: AUCUNE 
(C) VILLE: NARCY L'ETOILE 
<B} PAYS: FRANCE 
(F) CODE POSTAL: 69280 
10 (ii) TITRE DE L'INVENTION: Fragment nucl6otidique endog^ne associ6 

S une maladle auto- Immune, proc^de de marquage et r^actif • 
(ill) NOMBRE DE SEQUENCES; 31 
(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 
|A) TYPE DE SUPPORT: Floppy disk 
15 (B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC-DOS/MS-DOS 

<D) LOGICIEL: Patentin Release #1.0, Version #1.30 (OEB) 

(2> INFORMATIONS FOUR LA SEQ ID N0:1: 
20 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1511 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin6aire 
25 (ii) TYPE DE MOLECULE: A0N 

(Xl) DESCRIPTION DE LA SEQUENCE: SEQ ID NO:l: 

CCTAGAACGT ATTCTGGAGA ATTGGGACCA ATGTGACACT CAGACGCTAA GAAA6AAACG 60 

ATTTATATTC TTCTGCAGTA CCGCCTGGCC ACAATATCCT CTTCAAGGGA GAGAAACCTG 120 

GCTTCCTGAG GGAAGTATAA ATTATAACAT CATCTTACAG CTAGACCTCT TCTGTAGAAA 160 

30 6GAGGGCAAA TGGAGTGAAG TGCCATATGT GCAAACTTTC TTTTCATTAA GAGACAACTC 240 

ACAATTATGT AAAAAGTGTG GTTTATGCCC TACAGGAAGC CCTCAGAGTC CACCTCCCTA 300 

CCCCAGCGTC CCCTCCCCGA CTCCTTCCTC AACTAATAAG GACCCCCCTT TAACCCAAAC 360 

GGTCCAAAAG GAGATAGACA AAGGGGTAAA CAATGAACCA AAGAGTGCCA ATATTCCCCG 420 

ATTATGCCCC CTCCAAGCAG TGAGAGGAGG AGAATTCGGC CCAGCCAGAG TGCCTGTACC 480 

35 TTTTTCTCTC TCAGACTTAA AGCAAATTAA AATAGACCTA GGTAAATTCT CAGATAACCC 540 

TGACGGCTAT ATTGATGTTT TACAAGGGTT AGGACAATCC TTT6ATCTGA CATGGAGAGA 600 
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TATAATGTTA CTACTAAATC AGACACTAAC CCCAAATGAG AGAAGTGCCG CTGTAACTGC 660 
AGCCCGAGAG TTTGGCGATC TTTGGTATCT CAGTCAGGCC AACAATAGGA TGACAACAGA 720 
6GAAAGAACA ACTCCCACAG GCCAGCAGGC AGTTCCCAGT GTAGACCCTC ATTGGGACAC 780 
AGAATCAGAA CATGGAGATT GGTGCCACAA ACATTTGCTA ACTTGCGTGC TAGAAGGACT 840 
GAGGAAAACT AGGAAGAAGC CTATGAATTA CTCAATGATG TCCACTATAA CACAGGGAAA 900 
GGAAGAAAAT CTTACTGCTT TTCTGGACAG ACTAAGGGAG GCATTGAGGA AGCATACCTC 960 
CCTGTCACCT GACTCTATTG AAGGCCAACT AATCTTT^G GATAAGTTTA TCACTCAGTC 1020 
AGCTGCAGAC ATTAGAAAAA ACTTCAAAAG TCTGCCTTAG GCCCGGAGCA GAACTTAGAA 1080 
ACCCTATTTA ACTTGGCATC CTCAGTTTTT TATAATA6AG ATCAGGAGGA GCAGGCGAAA 1140 
CGGGACAAAC 6GGATAAAAA AAAAAGGGGG GGTCCACTAC TTTAGTCATG GCCCTCAGGC 1200 
AAGCAGACTT TGGAGGCTCT GCAAAAGGGA AAAGCTG6GC AAATCAAATG CCTAATAGGG 1260 
CTGGCTTCCA GTGCGGTCTA CAAGGACACT TTAAAAAAGA TTATCCAAGT AGAAATAAGC 1320 
CGCCCCCTTG TCCATGCCCC TTACGTCAAG GGAATCACTG GAAGGCCCAC TGCCCCAGGG 1380 
GATGAAGATA CTCTGAGTCA GAAGCCATTA ACCAGATGAT CCAGCAGCAG GACTGAGGGT 1440 
6CCCGGGGCG AGC6CCAGCC CAT6CCATCA CCCTCACAGA GCCCCGGGTA TGTTTGACCA 1500 
TTGAGAGCCA A 1511 



(2) IHFOBIATIONS POUR LA SEQ ZD NO: 2: 

(i) CARACTERISTIQUE3 DE LA SfiQUENCE: 

(A) LOKGUEUR: 2009 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DB MOLECULE: ADN 

(xi) DESCRIPTION DE LA SfeQUENCE: SEQ ID NO: 2: 
ATACGACTAC TATAGGGC6A ATTGGGCCCT CTAGATGCAT GCTCGAGCGG CCGCCAGTGT 60 
GATGGATATC TGCAGAATTC GCCCTTTGTC CGCTGTGCTC CTGATCCAGC GAGGCGCCCA 120 
TT6CTGCTCC CAATTGGGCT AAAGGCTTGC CATTGTTCCC ACACGGCTAA GTGCCCGGGT 180 
TCATCCTAAT TGAGCTGAAC ACTAGTCACT GGGTTCCATG GTTCTCTTCC ATGACCCACG 240 
GCTTCTAATA 6AGCTCTAAT ACTCACCACA TGGCCCAAGA TTCCATTCCT TG6AATCCGT 300 
GAGGCCAAGA ACCCCAGGTC AGAGAACACG AGGCTTGCCA CCGTCTTGGA AGTGGCCCGC 360 
CGCCATCTTG GGAGCTCTGG GAGCAAGGAC CCCCCAGTAA CATTTTGGCA ACCACAAAGG 420 
6ACCTCCAAA GCGATGGGAA ACATTCCCCC CAAGGCAAAA AC6CCCCTAA GATGTATTCT 480 
GGAGAATTGG GACCAATGTG ACACTCAGAC GCTAAGAAAG AAACGATTTA TATTCTTCTG 540 
CA6TAC06CC TGGCCACAAT ATCCTCTTCA AGGGAGAGAA ACCT66CTTC CT6AGGGAA6 600 
TATAAATTAT AACATCATCT TACAGCTAGA CCTCTTCTGT AGAAAGGAGG GCAAATG6AG 660 
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TGAAGTGCCA TATGTGCAAA CTTTCTTTTC 
GTGTGCTTTA TGCCCTACAC GAAGCCCTCA 
CCCGACTCCT TCCTCAACTA ATAAGGACCC 
AGACAAAGGG GTAAACAATG AACCAAAGAG 
5 AGCAGTGAGA GGA6GA6AAT TCGGCCCAGC 
CTTAAAGCAA ATTAAAATAG ACCTAGGTAA 
TGTTTTACAA G6GTTAGGAC AATCCTTTGA 
AAATCAGACA CTAACOCCAA AT6AGAGAAG 
CGATCTTTGG TATCTCAGTC AGGTCAACAA 

10 CACAGGCCAG CAGGCAGTTC CCAGTGTAGA 
AGATTGGTGC CACAAACATT TGCTAACTTG 
GAAGCCTATG AATTACTCAA TGATGTCCAC 
TGCTTTTCTG GACAGACTAA GGGAGGCATT 
TATTGAAGGC CAACTAATCT TAAAGGATAA 

15 AAAAAACTTC AAAAGTCTGC CTTAGGCCOG 
GCATCCTCA6 TTTTTTATAA TAGAGATCAG 
AAAAAAAAAA GGGGGGGTCC ACTACTTTAG 
GCrCTGGAAA AGGGAAAAGC TGGGCAAATC 
GTCTACAAG6 ACACTTTAAA AAAGATTATC 

20 6CCCCTTA0G TCAA6GGAAT CACT6GAAGG 
AGTCAGAA6C CATTAACCAG ATGATCCAGC 
CAGCCCATGC CATCACCCTN ACAGAGCCCC 
TTAACT6TCT OCTGGACACT GGCGCAGCC 



ATTAA6AGAC AACTCACAAT TATGTAAAAA 720 
GAGTCCACCT CCCTACCCCA CCGTCCCCCC 780 
CCCTTTAACC CAAACGGTCC AAAAGGAGAT 840 
TGCCAATATT CCCCGATTAT GCCCCCTCCA 900 
CAGAGTGCCT GTACCTTTTT CTCTCTCAGA 960 
ATTCTCAGAT AACCCT6ACX3 GCTATATTGA 1020 
TCTGACATGG AGAGATATAA TGTTACTACT 1080 
T6CC6CTGTA ACTGCAGCCC GAGAGTTTG6 1140 
TAGGATGACA ACAGAG6AAA GAACAACTCC 1200 
CCCTCATTGG GACACAGAAT CAGAACATGG 1260 
CGTGCTAGAA GGACTGAGGA AAACTAGGAA 1320 
TATAACACAG GGAAAGGAAG AAAATCCTAC 1380 
GAGGAAGCAT ACCTCCCTGT CACCTGACTC 1440 
GTTTATCACT CAGTCAGCTG CAGACATTAG 1500 
GAGCAGAACT TAGAAACCCT ATTTAACTTG 1S60 
GAGGAGCAGG CGAAACGGGA CAAACGGGAT 1620 
TCATGGCCCT CAGGCAAGCA GACTTTGGAG 1680 
AAATGCCTAA TAGGGCTGGC TTCCAGTGCG 1740 
CAAGTAGAAA TAA6CGGCCC CCTTGTCCAT 1800 
CCCACTGCCC CAGGGGATGA AGATACTCTG 1860 
AGCAG6ACTG A6GGTGCCCG GGGCGAGCGC 1920 
GGGTATGCTT GACCATTGAG AGCCAGGA6G 1980 

2009 



25 (2) ZKrORMATIONS POUR LA SEQ 10 KG: 3: 

(i) CAJ^CTERISTIQUCS DE LA SEQUENCE: 

(A) LONGUEUR: 1056 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: single 
30 (D) CONFIGURATION: lin6aire 

(ii) TYPE DE MOLECULE; ADN. 

(Xi) DESCRIPTION DE LA SfeQUENCE: SEQ ID NO: 3: 
CTAGAACGT ATTCTGGAGA ATTGGGACCA ATGTGACACT CAGACGCTAA GAAAGAAACG 
ATTTATATTC TTCTGCAGTA CCGCCT6GCC ACAATATCCT CTTCAAGGGA GAGAAACCTG 
35 GCTTCCTGAG GGAAGTATAA ATTATAACAT CATCTTACAG CTAGACCTCT TCTGTAGAAA 
GGAGGGCAAA T6GAGTGAAG TGCCATATGT GCAAACTTTC TTTTCATTAA GAGACAACTC 
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ACAATTATGT AAAAAGTGTG GTTTATGCCC TACAGGAAGC CCTCAGAGTC CACCTCCCTA 
CCCCAGCGTC CCCTCCCCGA CTCCTTCCTC AACTAATAAG GACCCCCCTT TAACCCAAAC 
GGTCCAAAAG GAGATAGACA AAGGGGTAAA CAATGAACCA AAGAGTGCCA ATATTCCCCG 
ATTATGCCCC CTCCAAGCAG TGAGAGGAGG AGAATTCGGC CCAGCCAGAG TGCCTGTACC 
5 TTTTTCTCTC TCAGACTTAA AGCAAATTAA AATAGACCTA GGTAAATTCT CAGATAACCC 
TGACGGCTAT ATTGATGTTT TACAAGGGTT AGGACAATCC TTTGATCTGA CATGGAGAGA 
TATAATGTTA CTACTAAATC AGACACTAAC CCCAAATGAG AGAAGTGCCG CTGTAACTGC 
AGCCCGAGAG TTTGGCGATC TTTGGTATCT CAGTCAGGCC AACAATAGGA TGACAACAGA 
GGAAAGAACA ACTCCCACAG GCCAGCAGGC AGTTCCCAGT GTAGACCCTC ATTGGGACAC 
10 AGAATCAGAA CATGGAGATT GGTGCCACAA ACATTTGCTA ACTTGCGTGC TAGAAGGACT 
GAGGAAAACT AGGAAGAAGC CTATGAATTA CTCAATGATG TCCACTATAA CACAGGGAAA 
GGAAGAAAAT CTTACTGCTT TTCTGGACAG ACTAAGGGAG 6CATTGAGGA AGCATACCTC 
CCTGTCACCT GACTCTATTG AAGGCCAACT AATCTTAAAG GATAAGTTTA TCACTCAGTC 
AGCTGCAGAC ATTAGAAAAA ACTTCAAAAG TCT6CCT 



IS 
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(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 25 paixes de bases 

(B) TYPE: nucleotide 



(C) NOMBRE DE BRINS: simple 



(D) CONFIGURATION: lin6aire 



25 



(ii) TYPE DE MOLECULE: ADN 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 



CGGACATCCA AAGTGATGGG AAACG 
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(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA stQUENCE: 
(A) LONGUEUR: 26 paires de bases 



(B) TYPE: nucleotide 
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(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADN 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 



GGACAGGAAA GTAAGACTGA GAAGGC 
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(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin6aire 

(ii) TYPE DE MOLECULE: ADN 

(xi) DESCRIPTION DE LA SfiQUENCE: SEQ ID NO: 6 
CCT AGA ACG TAT TCT GGA GAA TTG GG 

(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADN 

(xi) DESCRIPTION DE LA S£QUBNCE: SEQ ID N0:7. 
TGG CTC TCA ATG GTC AAA CAT ACC CG 

(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(xi) DESCRIPTION DE LA StQUEHCE; SEQ ID NO: 8: 
ATG GGA AAC GTV CCC CCC GAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
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(D) CONFIGURATION: lineaire 
(il) TYPE DE MOLECULE: ADN 

(xi) DESCRIPTION DE lA SEQUENCE: SEQ ID NO; 9: 
GGC CTA AGG CAG ACT TTT GAA 

(2) INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE lA SEQUENCE: 

(A) LONGUEUR: acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: sirnple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 
MGSSHHHHHHSSGLVP RGSHMASMTGGQQMGR 

IMGNIPPKAKT PLRCILENWD QCDTQTLRKK RFIPPCSTAW PQYPLQGRET 
WLPEGSINYN IILQLDLPCR KEGKWSEVPY VQTFPSLRDN SQLCKKCGLC 
PTGSPQSPPP YPSVPPPTFS STNKDPPLTQ TVQKEIDXGV NNEPKSANIP 
RLCPLQAVRG GEFGPARVPV PFSLSOLKQI KI0L6KFSDN PDGYIDVLQG 
LGQSFDLTWR DIKLLLNQTL TPNERSAAVT AAREFGDLWY LSQVNNRHTT 
EERTTPTGQQ AVPSVDPHVH) TBSEHGDWCH KHLLTCVLEG LRKTRKKPMN 
YSHMSTITQG KEENPTAFLD RLREALRKHT SLSPDSIEGQ LILKDKFITQ 

SAAOIRKNFK SLPXLAAALEHHHHKH 

(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: acides aicd.n6s 

(B) TYPE: acide anin^ 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 

Met Ala Ser Met Thr Gly Gly Gin Gin Met Gly Arg lie Met Gly Asn 
lie Pro Pro Lys Ala Lys Thr Pro Leu Arg Cys lie Leu Glu Arg 
lie Leu Glu Asn Trp Asp Gin Cys Asp Thr Gin Thr Leu Arg Lys Lys 
Arg Phe He Phe Phe Cys Ser Thr Ala Trp Pro Gin Tyr Pro Leu Gin 
Gly Arg Glu Thr Trp Leu Pro Glu Gly Ser He Asn Tyr Asn He He 
Leu Gin Leu Asp Leu Phe Cys Arg Lys Glu Gly Lys Trp Ser Glu Val 
Pro Tyr Val Gin Thr Phe Phe Ser Leu Arg Asp Asn Ser Gin Leu Cys 
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Lys Lys Cys Gly Leu Cys Pro Thr Gly Ser Pro Gin Ser Pro Pro Pro 
Tyr Pro Ser Val Pro Ser Pro Thr Pro Ser Ser Thr Asn Lys Asp Pro 
Pro Leu Thr Gin Thr Val Gin Lys Glu lie Asp Lys Gly Val Asn Asn 
Glu Pro Lys Ser Ala Asn He Pro Arg Leu Cys Pro Leu Gin Ala Val 
Arg Gly Gly Glu Phe Gly Pro Ala Arg Val Pro Val Pro Phe Ser Leu 
Ser Asp Leu Lys Gin He Lys He Asp Leu Gly Lys Phe Ser Asp Asn 
Pro Asp Gly Tyr He Asp Val Leu Gin Gly Leu Gly Gin Ser Phe Asp 
Leu Thr Trp Arg Asp He Net Leu Leu Leu Asn Gin Thr Leu Thr Pro 
Asn Glu Arg Ser Ala Ala Val Thr Ala Ala Arg Glu Phe Gly Asp Leu 
Trp Tyr Leu Ser Gin Ala Asn Asn Arg Met Thr Thr Glu Glu Arg Thr 
Thr Pro Thr Gly Gin Gin Ala Val Pro Ser Val Asp Pro His Trp Asp 
Thr Glu Ser Glu His Gly Asp Trp Cys His Lys His Leu Leu Thr Cys 
Val Leu Glu Gly Leu Arg Lys Thr Arg Lys Lys Pro Met Asn Tyr Ser 
Met Net Ser Thr He Thr Gin Gly Lys Glu Glu Asn Leu Thr Ala Phe 
Leu Asp Arg Leu Arg Glu Ala Leu Arg Lys His Thr Ser Leu Ser Pro 
Asp Ser He Glu Gly Gin Leu He Leu Lys Asp Lys Phe He Thr Gin 
Ser Ala Ala Asp He Arg Lys Asn Phe Lys Ser Leu Pro Lys Leu Ala 
Ala Ala Leu Glu His His His His His His 

(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 26 paires de bases 

(B) TYPE; nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADK 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 
CTAGAACGTA TTCTG6AGAA TTGGGA 26 

(2) INFORMATIONS POUR LA SEQ ID NO; 13: 

(i) CARACTERISTIQUES DE LA SfeQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE D£ MOLECULE: ADN 
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(xi) DESCRIPTION DE LA SgQUENCC: SEQ ID NO: 13: 
CCTAAGGCAG ACTTTTGAAG 20 

(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 54 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRIN5: single 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADN 

(xi) DESCRIPTION DE LA SfeQUENCE: SEQ ID NO: 14: 
TTTGGTAATA CGACTCACTA TAGGGCAGCC ACCATGGGAA ACGTTCCCCC CGAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 15: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 44 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: sicnple 

(D) CONFIGURATION: linfeaire 

(ii) TYPE DE MOLECULE: ADN. 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 
Yq,Yj.prpii.jq.cp TTTTTTTTTC AGGCTGCGCC AGTGTCCAGG AGAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 16: 

(i) CARACTERISTIQUES DE LA SfeQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN- 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16: 
TGTCCGCTGT GCTCCTGATC 



(2) INFORMATIONS POUR LA SEQ ID NO: 17: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 44 paires de bases 
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(B) TYPE: nucleotide 

(C) NOMBRE D£ BRIKS: simple 

(D) CONFIGURATION: lin6aire 
(ii) TYPE DE MOLECULE: ADN 

S (xi) DESCRIPTION OE LA SEQUENCE: SEQ ID NO: 17: 

TTTTTTTTTT TTTTTTTTTC AGGCTGCGCC AGTGTCCAGG AGAC 44 



(2) INFORMATIONS POUR LA SEQ ID NO: 18: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
10 (A) LONGUEUR: 678 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADN 

15 (xi) DESCRIPTION DE LA SfeQUENCE: SEQ ID NO: 18: 

TCAGGGATAGCCCCCATCTATTTGGCCAGGCATTAGCCCAAGACTTGAGCCAGTTCTCATACCTGGATAT 
TCTrGTCCTTTGGTATGCGGATGATTTACTTTTAGCCGCCCGTTCAGAAACCTTGTGCCATCAAGCCACC 
CAAGT6CTCTTAAATTTCCTCGCCACCTGTGGCTACAAGGTTTCCAAACCAAAGGCTCAGCTCT6CTCAC 
AGCA6AAGGCTATTTA0CCTAAATACTTA6GGCTGAAATTATCCAAAG6CACCAGGGCCCTCA6T6AGGA 

20 AT6TATCCAGCCTATACTGGCTTATCCTTAT0CCAAAACCCTAAAACAACTAAGAAGGTTOCTTGGGATA 
ATAGGCATAACAGGCATAACAGGTTTCTGCTGAATATGGArrCCCAAGTACGGCAAAATAGCCAGACCAT 
TATATACACTAATTAAGGAAACTCAGAAAGCCAATACCCATTTAGTAAGATGGACACCTGAAGCAGAGGC 
AGCTTTCCAGGCCGTAAAGAACACCCTAACCCAAGCCCCAGTGTTAA6CTTGCCAGCGGGGCAAGACTTT 
TCTTTCT6TGTCACAGAAAAAATAGGAATAGCTNTAGGAGTCCTTACACAGGTCCGAGGGACCAGCTT6C 

25 AACCCATGGCATACCTGAGTAAGGAAATTGATGTAGTGGCAAAGGGTT 



(2) INFORMATIONS POUR LA SEQ ID NO: 19: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 591 paires de bases 
30 (B) TYPE: nucleotide 

(C) NC»4BRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADN 

Cxi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 

35 CCATGGCCATCTACACTGAACAAGATTTATACAATCATGTCGTACCTAAGCCCCACAACAAAAGAGTACC 
CATTCTTCCTTTTGTTATCAGAGCAGGAGTGCTAGGCAGACTAGGTACTGGCATTGGCAGTATCACAACC 
TCTACTCAGTTCTACTACAAACTATCTCAAGAAATAAATGGTGACATGGAACAGGTCACTGACTCCCTGG 
TCACCTTGCAA6ATCAACTTAACTCCCTAGCAGCAGTAGTCCTTCAAAATCGAAGAGCTTTAGACTTGCT 
AACCGCCAAAAGAGGGGGAACCTGTTTATTTTTAGGAGAAGAACGCTGTTATTATGTTAATCAATCCAGA 

40 ATTGTCACTGAGAAAGTTAAAGAAATTCGAGAXCGAATACAATGTAGAGCAGAGGAGCTTCAAAACACCG 
AACX;CTGGGGCCTCCTCAGCCAATGGATGCCCTGGGTTCTCCCCTTCTTAGGACCTCTAGCA6CT^ 
ATTGTTACTCCTCTTT6GACCCTCTATCTTTAACCTCCTTGTTAAGTTTGTCTCTTCCAGAATTGAAGCT 
GTAAAGCTACAGATGGTCTTACAAATCTAGA 
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(2) INFORMATIONS POUR LA SEQ ID NO: 20: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1321 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADN 

(xi) DESCRIPTION DE LA S^^QUENCE: SEQ ID NO:20: 
CAACAATCGGGATATAAACCCAGGCATTCGAGCXGGCAACAGCAGCCCCCCTTTGGGTCCCTTCCCTTTG 
TATG6GAGCTGTTTTCATGCTATTTCACTCTATTAAATCTTGCAACTGCACTCTTCTGGTCCATGTTTCT 
TACG6CTCGAGCTGAGCTTTTGCTCACCGTCCACCACTGCTGTTTGCCACCACCGCAGACCTGCCGCTGA 
CTCCCATCCCTCTGGATCCTGCAGGGTGTCCGCTGTGCTCCTGATCCAGCGAAGCGCCCATTGCCGCTCC 
CAATTGGGCTAAAGGCTTGCCATTGTTCCTGCACGGCTAAGTGCCTGGGTTTGTTCTAATTGAGCTGAAC 
ACTAGTCACTGGGTTCCATGGTTCTCTTCTGTGACCCACGGCTTCTAATAGAACTATAACACTTACCACA 
TGGCCCAAGATTCCATTCCTTGGAATCCGTGAGGCCAA6AACTCCAGGTCAGAGAATACGAAGCTTGCCA 
CCATCTTGGAAGCGGCCTGCTACCATCTTGGAAGTGGTTCACCACCATCTTGGGAGCTCTGTGAGCAAGG 
ACCCCCCXK3TAACATTTTGGCAACCACGAACGGACATCCAAAGTGATGGGAAACGTTCCCC»CAAGACAA 
AAACGCCX:CTAAGACGTATTCTGGAAAATTGGGAACAATTTGACCCTCAGACACTAAGAAAGAAAOG^^ 
TATATTCrTCTGCAGTGCCGCCTGGCACTCCTGAGGGAAGTATAAATTATAACACCATCn^ACAGCT^ 
CCTCTTTTGTAGAAAAGGCAAATGGAGTGAAGTGCCATAAGTACAAACTTTCTTTTCATTAAGAGACAAC 
TCACAATTATGTAAAAAGTGTCATTTATGCCCTACAGGAAGCCTTCAGAGTCTACCTCCCTATCCCAGCA 
TCCCCGACTCCTTCCCCACTTAATAAGGACCCCCCTTCAACCCAAATGGTCCAAAAGGA6ATAGACAAAA 
GGGTAAACAGTGAACCAAAGAGTGCCAATATTCCCCAATTATGACCCCTCCAAGCAGTGGGAGGAAGAGA 
ATTCGGCCCAGCCAGAGTGCATGTGCCTTTTTCTCTCCCAGACTTAAAGCAAATAAAAACAGACTTAGGT 
AAATTCTCAGATAACCCTGATGGCTATATTGGTGTTTTACAAGGGTTAGGACAATTCTTTGATCTGACAT 
GGAGAGATATATATGTCACTGCTAAATCAGACACTAACCCCAAATGAGAGAAGTGCCACCATAACTGCAG 
CCTGAGAGTTTGGCGATCtCTGGTATCTCAGTCAGGTCAATGATAGGATGACAACAGAGGA 

(2) INFORMATIONS POUR LA SEQ ID NO: 21: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2938 paires de bases 

(B) TYPE: nucleotide 

(C) NC»ffiRE DE BRINS: sixnple 

(D) CONFIGURATION: lineal re 

(ii) TYPE DE MOLECULE: ADN - 

(xi) DESCRIPTION DE LA StQUENCE: SEQ ID N0:21: 
CAACGACGGACATCCAAAGTGATGGGAAACGTTCCCCGCAAGACAAAAACGCCCCTAAGACGTATTCTGG 
A6AATTGGGACCAATTTGACCCTCAGACACTAAGAAAGAAACGACTTATATTCTTCTGCAGTGCCGCCTG 
GCACTCCTGAGGGAAGTATAAATTATAACACCATCTTACAGCTAGACTTCTTTTGTAGAAAAGGCAAATG 
GAGTGAAGTGCCATAAGTACAAACTTTCTTTTCATTAAGAGACAACTCACAATTATGTAAAAAGTGX6AT 
TTATGCCCTACAGGAAGCCTTCAGAGTCTACCTCCCTATCCCAGCATCCCOGACTCCTTCCCCAACTAAT 
AAGGACCCCCCTTCAACCCAAATGGTCCAAAAGGAGATAGACAAAAGGGTAAACAGTGAAOCAAAGAGTG 
CCAATATTCCCCAATTATGACCCCTCCCAAGCAGTGGCAGGAAGAGATTCGGCCCAGCCAGAOTGCATGT 
GCTTTTTCTTCTCCCAGACTTAAAGCAAATAAAAACAGACTTAGGTAAATTCTCAGATAATCCTGATGGC 
TATATTGATGTTTTACAAGGGTTAGGACAATTCTTTGATCTGACATGGAGAGATATAATGTCACTGCTAA 
ATCAGACACTAACCCCAAATGAGAGAAGTGCCACCATAACTGCAGCCTCAGAGTTTCGCGATCTCTGGTA 



34 



TCTCA6TCAGGTCAATGATAGGATGACAACAGAGGAAAGAGATGATCCCCACAGCCAGCAAGCAGTTCCC 
A6TCTASACCCTCATTGGGGACACAGAAATCAGTAACATGGGAGATTGGTGCTGCAGACATTTGCTAACT 
TGTGTGCTACAAGGACTAAGGAAAACTACGAAGAAAATCTAOGAATTACTCAATGATGTCCACCATAACA 
CAGGGGAACGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGO^TTGAGGAAGCGTGCCTCT 
5 CTGTCACCTGACTCTTCTGAAGGCCAACTAATCTTAAAGCGTAAGTTTATCACTCAGTCAGCTG^^ 
TTAGAAAAAACTTCAAAAGTCTGCCGTAGGCCCGGAGCAAAACTTAGAAACCCTATTCAACTTGGC^ 
TCGGTTTTTTATAATAGAGATCAGGAGGAGCAGGCGGAACAGGACAAACGGGATTAAAAAAAAGGCCACC 
GCTTTAGTCATGACCCTCAGGCAAGTGGACTTTGGAGGCTCTGGAAAAG6GAAAA6CTGGGCAAATTC 
TGCCTAATAGG6CTTGCTTCCAGTGCGGTCTACAAGGACACTTTAAAAAAGATTGTCCAAGTAGAAGTM 
10 GCCGCCCCTTCGTCCATGCCCCTTATTTCAAGGGAATCACTGGAAGGCCCACTGCa:^ 

TCTTTTGAGTCAGAAGCCACTAACCAGATGATCCAGCAGCAGGACTGAGGGTGCCTCGGGCAAGO^CCAT 
CCCATGCCATCACCCTCACAGAGCCCTGGGTATGCTTGACCATTGAGGGCCAGGAAGGTTGTCTCCTGGA 
CACTGGTGCGGTCTTCTTAGTCrrTACTCTTCTGTCCC«GACAACTGTCCTCCAGATCTGTCACTAT^ 

gggggtcctaagacgggcagtcactagatacttctcccagccactaagttatgactggggagctttattc 
15 ttttcacyitgctlttctaattatgcttgaaagccccactaccttgttagggagagacattct^ 

caggggccattatacacctcaacataggagaaggaacacccgrttgttctcx:cctgcttgaggaaggaat 
taatcctcaagtgtgggcaacagaaggacaatatggacgagcaaagaatgcccgtcctgttcaagttaaa 
ctaaaggattccacttcx:ttt(xk:taccaaaggca6TAccccctcagacccaaggtc 
aaaagattgttaaggacttaaaagcxxju^gocttagtaaaacx:atgcataactcc(n^ 

20 AGTCGATTGAGGAGGCACAGAAACCCAGTGGACAGTGGAGGGmGTGCAAGATCTCAGGATTATCAATG 
GAGGCCGTTGTCCTTTTATACCCAGCTGTACCTAGCCCTTATACTGTGCTTTCCCAAATACCAGAGGAAG 
CAGAGTGGTTTACACTCCTGGACCTTAAGGATGCCTTCTTCTGCATCCCTGTACATCCTGACTCTCAATT 
CTTGTTTGCCTTTGAAGATACTTCAAACCCAACATCTCAACTCACCTGGACTGTTTTACCCCAACGGrTC 
AGGGATAGCCCCCATCTATTTGGCCAGGCATTAGCCCAAGACTTGAGCCAATCCn'CATACCTGGACACCT 

25 GTCCTTOGGTAGGTGGATGATTTACTTTTGGCCGCCCATTCAGAAACCTTGTGCCATCAAGCCACCCAAG 
CGCTCTTCAATTTCCTCGCTACCTGTGGCTACATGGTTTCCAAACCAAAGGCTCAACTCTGCTCACAGC^ 
GGTTACTTAGGGGTAAAAT7ATCCAAAGGCACCA6GGCCCTCAGTGAGGAACACATCCAGCCTATACTGG 
CTTATCCTCATCCCAAAACCCTAAA6CAACTAA6GGGATTCCTTGGCGTAATAGGTTTCTGC0GAAAATO 
GATTCCCAG6TTTGGCGAAATAGCCAGGTCATTAAATACACTAATTAAGGAAACTCAGAAAGCCAATACC 

30 CATTTAGTAAGATGGACAACTGAAGTAGAAGTGGCTTTCCAGGCCCTAACCCAAGCCCCAGTGT^^ 

TGCCAACAGGGCAAGACTTTTCTTCATATGTCACA6AAAAAACAGGAATAGCTCTAGGAGTCCTTACACA 
GATCCGAGGGATGAGCTTGCAACCTGTGGCGTACXtTGACTAAGGAAATTGATGTAGTGGCAAAGGGn 

(2) INFORMATIONS POUR LA SEQ ID NO: 22: 
35 (i) CARACTBRISTIQUES DE LA s6qUENCE: 

(A) LONGUEUR: 1422 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin6aire 

40 (ii) TYPE DE MOLECULE: ADN- 

(xi) DESCRIPTION DE LA s£QU£KCE: SEQ ID NO: 22: 
TCAGGGATAGCCCCCATCTATTTGGCCAGGCATTAGCCCAAGACTTGAGTCAGTTATCATACCTGGACAC 
TCTTGTCCTTCAGTATGTGGATGATTTACTTTTAGCTGCCTGTTCAGAAACCTTGTGCCATCAAGCCACC 
CAAGCACTCTTAAATTTCCTCGCCACCTGTGGCTACAAGGTTTCCAAAGAGAAGCTCAGCTCTGCTCACA 

45 GCAGGTTAAATACTTAGGACTAAGATTATCCAAAGGCACCAAGGCCCTCAGTGAGGAATGTATCCAGCCT 
ATACTGGCTTATCCTCATCTCAAAACCCTAAAGCAACrAAGAGAGTTCCTTGGCATAACAGGCTTCTGCC 
6AATATGGATTCCCCAGGTATGGCAAAATA6CCAGGCCATTATATACAGTAATTAAGGAAACTCAGAAAG 
C(»ATACCCATTTAATAAGATGGATACCTGAAGCCAAAGTGGCTTTCCAGGCCCCTAAAGAAGGCCTTAA 
ACCCAAGTCCCAGTGTTAAGCTTGCCAACGGGGCAAGACTTTTCTTTATACATCACAGAAAAAAACAGAA 

50 ACAGCTCTGGGAGTCCTTACACAGGTCCAAGGGACGAGCTTGCAACCCATGGCATACCTGAGTAAG6AAA 
CTGATGTAGTGGCAAAGGGTTGGCTTCATTGTTTATGGGTAGTGGTGGCAGTAGCAGTTGTAGTATCTGA 
AGCAGTTAAAATAATACAGGGGAGAGATCTTACTCTGTGGACATCTCATGACGTGAACAGCATACTCACT 
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GCTAAAGCAGACTTGTGGCTGTCAGACAACCGTTTACTTAAATATCAGGCTCTATTACTTGAAAGGCCAG 
TGCTGCAACTGTGCACTTGTGCAACTCTTAACCCAGTCNCATTTCTTCCAGACAATGAAGATAGAATATA 
ACTGTCAACAAATAATTTCTCAAACCTATGCCACTCGAGGGGACCTTCTAGAAGTTCCCTTGACTGATCC 
TGACCrrTCAACTTGTATACTGATGGAAGTTCCTTTGTAGAAAAAGGACTTCyuUVAGCGGGGTATGCAGTG 
GTCAGTGATAATGGAATATTTGAAAGTATCCCCTCACTCCAGGAACTAGTGCTTAGCTGGCAGAACTAAT 
AGCCTTCATT6GCGCACTAGAATTAGGAGAAGGAAAAAGGGTAAATATATATACAGACTCTCAGTAT6CT 
CACCTAGTCNTCCATGCCCATGAGGCAATATGCAGAGAAAGGGAATTCCTAACTTGCGAGGGAACACCTA 
TCACACATCAGGAAGCCATTAGGAGATTATTACTGGCAGTACAGAAACCTAAA6AGGTGGAAGTCTTACA 
CTGCTGGGGTCATCAGAAAGGAAAGAAAAGGGAAATAGAAGGGAATTGCCAAGCAGATATTGAAGC^^ 
AGAGCTGCAAGGCAGGACCCTC 



(2) INFORMATIONS POUR LA SEQ ID N0:23: 

(1) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2006 paires de bases 

(B) TYPE: nucleotide 

(C) NONBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADN 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO:23: 
ATGCAGTGGTCAGTGATAATGGAATACTTGAAACTAATCCCCTCACTCCAGGAACTAGTGCTCAGCTAGC 
AGAACTAATAGCCCTCACTTGGGCACTAGAATTAGGAGAAGAAAAAAGGGCAAATATATATACAGACTCT 
AAATATGCTTA(XTAGTCCTCCATGCCCATGCAGCAATATGGAAAGAAAGGGAATTCCTAACTTCTGAGA 
GAACACCTATCAAACATCAGGAAGCCATTAGGAAATTATTATTGGCTGTACAGAAACCTAAAGAGGTG^ 
AGTCTTACACTGCCGGGGTCATCANAAAGGAAAGGAAAGG6AAAATACTTTT6CCTGCAACTATCCAATG 
GAAATTACTTAAAACCCTTCATCAAA0CTTTCACTTA6GCAT0GATAGCACCCATCAAATGGCCAM 
TTATTTACTGGACCAGGCCTTTTCAAAACTATCAAGCAAATATTCAGGGCmTGAATTGTGCCAAAA^ 
ATAATCCCCTGCCTCATCGCCAAGCTCCTTCAGGAAAACT^AAAAACAGGCCATTACCCTGAAAAAAACTO 
CCAACTGATTTTACCCACAAGCCCAAACCTCAGGGATTTCAGTATCTACTAGTCTGGGTAAATACTTTCA 
CGGGTTGGGCAAAGGCCTTCCCCTGTAGGACAGAAAAGGCCCAAGAGGTAATAAAGGCACTAGTTCATGA 
AATAATTCCCAGATTCGGACTTCCCCGAGGCTTACAGAGTGACAATA6CCCTGCTTTCCAGGCCACAGTA 
ACCCAGGGAGTATCCCAGGCGTTAGGTATACGATATCACTTACACTGCGCCTGAAGGCCACAGTCXrrCAG 
GGAAGGTCGAGAAAATGAATGAAATACTCAAAGGACATCTAAAAAAGCAAACCCUVGGAAACCCACCTCAC 
ATG6CCTGCTGTGTTGCCTATAGCCTTAAAAAGAATCTGCAACTTTCCK:CAAAAAGGAG6ACTTA 
TACGAAATGCTGTATGGAAGGCCCTTCATAACCAATGACCTTGTGCTTGACCCAAGACAGO^ 
TGCACAOVTCACCTCCTTAGCCAAATATCAACAAGTrCTTAAAACATTACAAGGAACCTATCCCTGAGM 
GAGGGAAAAGAACTATTCCACCCTTGTGACATGGTATTAGTCAAGTCCCTTCTCTCTAATTCCCCATCCC 
TAGATACATCCTGGGAAGGACCXrrACCCAGTCATTTTATTTACCCCAACTGCGGTTAAAGTGGCTGGAGT 
GGTCTTCGATACATCACACTTCAGTCAAATCCTGGATACTGCCAAAGGAACCTGAAAATCCAGGAGACAA 
CGCTAGCTATTCCTGTGAACCTCTAGAGGATTTGCGCCTGCTCTTCAAACAACAACCAGGAGGAAAGTAA 
CTAAAATCATAAATCCCX:CATGGCCCTCCCTTATCATATTTTTCTCTTTACTGTTCTTTTACCCTCTTT 
ACTCTCACTGCACCCCCTCCATGCCGCTGTATGACCAGTAGCTCCCCTTACCAAGAGTTTCTATGGAGAA 
TGCAGCGTCCCGGAAATATTGATGCCCCATCGTATAGGAGTCTTTCTAAGGGAACCCCCACCTTCACTGC 
CCACACCCATATGCCCCGCAACTGCTATCACTCTGCCACTCTTTGCATGCATGCAAATACTCATTATT^ 
ACA6GAAAAATGATTAATCCTAGTTGTCCTGGAGGACTTGGAGTCACTGTCT6T7GGACTTACTTCACCC 
AAACT66TATGTCTGAT6GGGGTGGAGTTCAAGATCAGGCAAGAGAAAAACATGTAAAAGAAGTAATCTC 
CX:AACn*C»CCOGGGTACATGGCACCTCTAGCCCTACAAAGGACTAGATCTCTCAAAACTAGATGAM 
TCCGTACCCATACTCGCCTGGTAAGCCTATTTAATACCACCCTCACT0GGCTCCATGAGGTCT06GCCCA 
AAACCCTACTAACTGTTGGATATGCCTCCCCCTGAACTTCAAGCCA 



(2) INFORMATIONS POUR LA SEQ ID KO:24: 
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(i) CAJVVCTERI5TIQUES D£ LA seQUCNCE: 

(A) LONGUEUR: 1946 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DB BRINS: simple 
5 (D) CONFIGURATION: lineal re 

(ii) TYPE DE MOLECULE: ADN 

(xi) DESCRIPTION DE LA S&QUENCE: SEQ ID NO:24: 
ACTGCACrCTTCTGGTCCATGTTTCTTACCGCTCGAGCTGAGCTTTTGCTCACCGTCCACCACTGCTGTT 
TGCCACCACCGCANACCTGCCGCTGACTCCCATCCCTCTGGATCCTGCAGGGTGTCCGCTGTGCTCCTGA 

10 TCCAGCGAGGCGCCCATTGCCGCTCCCAATTGGGCTAAAGGCTTGCCATTGTNCCTGCACGGCTAAGTGC 
CTGGGTTTGTTCTAATTGAGCTGAACACTANTCACTGGGTTCCATGGTTCTCTTCTGTGACCCACGGCTT 
CTAATAGAACTATAACACTTACCACATGGCCCAAGATTCCATTCCTTGGAATCCGTGAGGGCAAGAACTC 
CAGGTCAGAGAATACGAGGCTTGCCACCATCTTGGAAGCGGCCTGCTACCATCTTGGAAGTGGTTCACCA 
CCATCTT6GGAGCTCTGTGA6CAAGGACCCCCCGGTAACATTTTGGCAACCACGAA06GACATCCAAAGT 

15 GATACATCCTGGGAAGGACCCTACCCAGTCATTTTATCTACCCCAACTGCGGTTAAA6TGGCT6GAGTGG 
AGTCTTG6ATAGATCACACTT6AGTCAAATCCTGGATACTGCCAAAGGAACCTGAAAATCCAGGAGACAA 
06CTAGCTATTCCTGTGAACCTCTAGAGGATTTGCGCCTGCTCTTCAAACAACAACCAGGAGGAAAGTAA 
CTAAAATCATAAATCCCCAT6GCCCTCCCTTATCATATTTTTCTCTTTACTGTTGTTTCAOCCTCTTTCA 
CTCTCACTGCACCCCCTCCATGCCGCTGTATGACCAGTAGCTCCCCTTACCAAGAGTTTCTATGGAGAAT 

20 GCA6CGTCCCGGAAATATTGATGCCCCATCGTATAGGAGTCTTTGTAA6GGAACCCCCACCTTCACTGCC 
CACACCCATATGCCCCGCAACTGCTATCACTCTGCCACTCTTTGCATGCATGCAAATACTCATTATTGGA 
CAGGAAAAATGATTAATCCTAGTTGTCCTGGAGGACTTGGAGTCACTGTCTGTTGGACTTACTTCACCGA 
AACT6GTATCTCTGATGGGGGTGGA6TTCAAGATCAGGCAA6AGAAAAACATGTAAAAGAAGTAATCTCC 
CAACTCAGCCGGGTACATGGCACCTCTAGCCCCTACAAAGGACTA6ATCTCTCAAAACTACATGAAACCC 

25 TCCGTACCCATACTaSCCTGGTAAGCCTATTTAATACCACCCTCACTGGGCTCCATGAGGTCTCGGC^ 

AAACCCTACTAACTGTTGGATATGCCTCCCCCTGAACTTCAGGCCATATGTTTCAATCCCTGTACCTGAA 
CAATGGAACAACTTCACCACAGAAATAAACACCACTTCCGTTTTAGTAGGACCTCTTGTTTCCAATCTGG 
AAATAACCCATACCTCAAACCTCACCTGTGTAAAATTTAGCAATACTACATACACAACCAACTCCCAATG 
CATCAGGTGGGTAACTCCTCCCACACAAATAGTCTGCCTACCCTCAGGAATATTTTTTGTCTGTGGTACC 

30 TCAGCCTATCGTTGTTTGAATCGCTCTTCACAATCTATGTGCTTCCTCTCATTCTTAGTGCCCCCTATGG 
CCATCTACACTGAACAAGATTTATACAGTTATGTCATATCTAAGCCCCGCAACAAAAGAGTACCCATTCT 
TCCTTTTGTTATAGGAGCAGGAGTGCTAGGTGCACTAGGTACTGGCATTGGCGGTATCACAACCTCTACT 
CAGTTCTACTACAAACTATCTCAAGAACTAAATGGGGACATGGAAaKSGTCGCXXSACTCCCntSGTCA 
TGCAAGATCAACTTAACTCCCTAGCAGCAGTAGTCCTTOUVAATCGAAGAGCTTTAGACTT^ 

35 TGAAAGAGGGGGAACCT6TTTATTTTTAG6GGAAGAATGCTGTTATTATGTTAATCAA 



(2) INFORMATIONS POUR LA SEQ ID NO: 25: 

(i) CARACTERISTIQUBS DE LA SEQUENCE: 

(A) LONGUEUR: 1136 paires de bases 
40 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25: 
45 CCATGGCCATCTACACTGAACAAGATTTATACAGTTATGTCATATCTAAGCCCCGCAACAAAAGAGTACC 
CATTCTTCCTTTTGTTATAGGAGCAGGAGTGCrAGGTGCACTAGGTACTGGCATTGGCGGTATCACAACC 
TCTACTCAGTTCTACTACAAACTATCTCAAGAACTAAATGGGGACATGGAACGG6TCGCCGACTCCCTGG 
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TCACCTTGCAAGATCAACTTAACTCCCTAGCAGCAGTAGTCCTTCAAAATCGAAGAGCTTTAGACTCGCT 

AACCGCTGAAAGAGGGGGAACCTGTTTATTTTTAGGGGAAGAATGCTGTTATTATGTTAATCAATC^ 

ATCGTCACTGAGAAAGTTAAAGAAATTCGAGATCGAATACAACGTAGAGOVGAAGAGCTTCGAAACAC^^ 

GACCCTGGGGCCTCCTCAGCCAATGGATGCCCrGGATTCrCCCCTTCTTAGGACCTCTAGCAGCTATAAT 

ATTGCTACPCCTCTTTGGACCCTGTATCTTTAACCrcCTTGTTAACTTTGTCTCTTCCAGAATC 

GTAAAACTACyVAATGGAGCCavAGATGCAGTCCAAGACTAAGATCTACCGCAGACCCCn'GGACC 

CTAGCCCACGATCTGATGTTAATGACATCAAAGGCACCCCTCCTGAGGAAATCTCAGCTGCACAACCTCT 

ACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGCGGTCGTCGGCCAACCTCCCCAACAGCACTTAGGTOT 

TCCTGTTGAGATGGGGGACTGAGAGACAGGACTAGCTGGATTTCCTAGGCTGACTAAGAATCCCTAAGCC 

TAGCTGGGAAGGTGACCACATGCACCTTTAAACACGGGGCTTGCAACTTAGTTCACACCT^ 

AGAGCTCACTAAAATGCTAATTAGGCAAAGACAGGAGGTAAAGAAATAGCCyKATCATCTATTGCATGAGA 

GCACAGCAGGAGGGACAATGATCGGGATATAAACCCAAGTCTTCGAGCCGGCy^CGGCAACCCCCTTTGG 

GTCCCCTCCCTTTGTATGGGAGCTCTGTTTTCATGCTATTTCACTCTATTAAATCTTGCAGCTGCGAAAA 

AAAAAAAAAAAAAAAA 



(2) INFORMATIONS POUR LA SEQ ID NO: 26: 

(1) CAPACTERISTIQUES DE LA SEQUENCE: 

(A) LOMGUEUR: 2782 palres de bases 

(B) TYPE: nucleotide 

(C) NOMBRE OE BRINS: siitiple 

(D) CONFIGURATION: lin6aire 
(ii) TYPE DE MOLECULE: ADN 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO:26: 
ATGG6AGCTGTTTTCATGCTATTTCACTCTATTAAATCTTGCAACTGCACTCTTCTGGTCCATGTTTCTT 
ACGGCTCGAGCTGAGCTTTTGCTCACCGTCCACCACTGCTGTTTGCCACCACCGCAGACCTGCCGCTGAC 
TCCCATCCCTCTGGATCCTGCAGGGTGTCCGCT6TGCTCCTGATCCAGCGAAGCGCCCATTGCCGCTCCC 
AATTGGGCTAAAGGCTTGCCATTGTTCCTGCACGGCTAAGTGCCTGGGTTTGTTCTAATTGAGCTGAACA 
CTAGTCACTGGGTTCCATGGTTCTCTTCTGTGACCCACGGCTTCTAATAGAACTATAACACTTACCACAT 
GGCCCAAGATTCCATTCCTTGGAATCCGTGAGGCCAACGAACTCCAGGTCAGAGAATACGAAGCTTGCCA 
CCATCTTGGAAGCGGCCTGCTACCATCTTGGAAGTGGTTCACCACCATCTTGGGAGCTCTGTGAGCAAGG 
ACCCCCCGGTGACATTTTGGCGACCACCAACGGACATCCCAAGTGATACATCCTGGGAAGGACCCTACCC 
AGTCATTTTATCTACCCCAACtGCGGTTAAAGTGGCTGGAGTGGAGTCTTGGATACATCACACTTGAGTC 
AAATCCTGGATACTGCCAAAGGAACCTGAAAATCCAGGAGACAACGCTAGCTATTCCTGTGAACCTCTAG 
AGGATTTGCGCCTGCTCTTCAAACAACAACCAGGAGGAAAGTAACTAAAATCATAAATCCCCATGGGCCT 
CCCTTATCATATTTTTCTCTGTAGTGTTCTTTCACCCTGTTTCACTCTCACTGCACCCCCTCCATGCCGC 
TGTATGACCAGTAGCTCCCCTCACCCAGAGTTTCTATGGAGAATGCAGCGTCCCGGAAATATTGATGCCC 
CATCGTATAGGAGTCTTTCTAAGGGAACCCCCACCTTCACTGCCCACACCCATATGCCCCGCAACTGCTA 
TCACTCTGCCACTCTTTGCATGCATGCAAATACTCATTATTGGACAGGAAAAATGATTAATCCTAGTTGT 
CCTGGAGGACTTGGAGTCACTGTCTGTTGGACTTACTTCACCCAAACTGGTATGTCTGATGGGGGTGGAG 
TTCAAGATCAGGCAAGAGAAAAACATGTAAAAGAAGTAATCTCCCAACTCACCG6GGTACATGGCACCTC 
TAGCCCCTACAAAGGACTAGATCTCTCAAAACTACATGAAACCCTCCGTACCCATACTCGCCTGGTAAGC 
CTATTTAATACCACCCTCACTGGGCTCCATGAGGTCTCGGCCCAAAACCCTACTAACTGTTGGATATGCC 
TCCCCCTGAACTTCAGGCCATATGTTTCAATCCCTGTACCTGAACAATGGAACAACTTCAGCACAGAAAT 
AAACACCACTTCCGTTTTAGTAGGACCTCTTGTTTCCAATGTGGAAATAACCCATACCTCAAACCTCACC 
TGTGTAAAATTTAGCAATACTACATACACAACCAACTCCCAATGCATCAGGTGGGTAACTCCTCCCACAC 
AAATAGTCTGCCTACCCTCAGGAATATTTTTTGTCTGTGGTACCTCAGCCTATCGTTGTTTGAATGGCTC 
TTCAGAATCTATGTGCTTCCTCTCATTCTTAGTGCCCCCTATGACCATCTACACTGAACAAGATTTATAC 
AGTTATGTCATATCTAAGCCCCGCAACAAAAGAGTACCCATTCTTCCTTTTGTTATAGGAGCAGGAGTGC 
TAGGTGCACTAGGTACTGGCATTGGCGGTATCACAACCTCTACTCAGTTCTACTACAAACTATCTCAAGA 
ACTAAATGGGGACATGGAACGGGTCGCCGACTCCCTGGTCACCTTGCAAGATCAACTTAACTCCCTAGCA 
GCAGTAGTCCTTC6AAATCGAAGAGCTTTAGACTTGCTAACCGCTGAGAGAGGGG6AACCTGTTTATTTT 
TAGGGGAAGAATGCTGTTATTATGTTAATCAATCCGGAATCGTCACTGAGAAAGTTGAAGAAATTCCAGA 
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TCGAATACAACGTATAGCAGAGGAGCTTCGAAACACTGGACCCTGGGGCCTCCTCAGCCGATGGATGCCC 
TGGATTCTCCCCTTCTTAGGACCTCTAGCAGCTATAATATTGCTACTCCTCTTrGGACCCTGTATCTTTG 
ACCTCCTTGTTAACTTTGTCTCTTCCAGAATCGAAGCTGTGAAACTACAAATGGAGCCCAAGATGCAGTC 
CAAGACTAAGATCTACCGCAGACCCCTGGACCGGCCTGCTAGCCCAaSATCPGATGTTAA^^ 
5 GGCACCCCTCCTGAGGAAATCTCAGCTGCACAACCTCTACTACGCCCCAATTCAGCAGGAAGtt 

GCGGTGGTCGGCCAACCTCCCCAACAGCACTTAGGTTTTCCTGTTGAGATGGGGGACTGAGAGACAGGAC 
TAGCTGGATTTCCTAGGCT6ACTAAGAATCCTTAAGCCTAGGTGGGAAGGTGACCACATCCy\CCTOT 
CACGGGGCTTGCAACTTAGCTCACACCTGACCAATCAGAGAGCTCACTAAAATGCTAATTAGGC^^ 
AGGAGGTAAAGAAATAGCCAATCATTTATTGCCTGAGAGCACAGCAGGAGGGACAATGATCGGGATATAA 
10 ACCCAAGTTTTCGAGCCGGCAACGGCAACCCCCTTTGGGTCCCCTCCCTTTGTATGGGAGCTCTGTTTTC 
ATGCTATTTCACTCTATTAAATCTTGCAACTGCAAAAAAAAAAAAAAAAAAA 



(2) INFORMATIONS POUR LA SEQ ID NO:27: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

15 (A) LONGUEUR: 666 palres de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRZNS: simple 

(D) CONFIGURATION: lin6aire 

(ii) TYPE DE MOLECULE: ADN 

20 (xi) DESCRIPTION DE LA SEQUENCE: SEO ID NO:27: 

TGTCCGCTGTGCTCCTGATCCAGCGA6GC6CCCATTGCCGCTCCCAATTGGGCTAAAGGCTTGCCATTGT 
TCCTGCACGGCTAAGT6CCTGGGTTTGTTCTAATTGAGCTGAACACTANTCACTGGGTTCCATGGTTCTC 
TTCTGTGACCCACGGCTTCTAATATAACTATAACACTTACCACATGGCCCAAGATTCCATTCCTTGGAAT 
CCGTGAGGCCAAGAACTCCAGGTCAGAGAATACGAGGCTTGCCACCATCTTGGAAGCGGCCTGCTACCAT 

25 CTTGGAAGTGGTTCACCACCATCTTGGGAGCTCTGTGAGCAAGGACCCCCCGGTAACATTTTGGCAACCA 
CGAACGGACATCCAAAGTGAATCGAAGCTGTAAAACTACAAATGGAGCCCAAGATGCAGTCCAAGACTAA 
GATCTACCGCAGACCCCTGGACCGGCCTGCTAGCCCACGATCTGATGTTAATGACATCAAAGGCACCCCT 
CCTGAGGAAATCTCAGCTGCACAACCTCTACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGCGGTCGTC 
GGCCAACCTCCCCAACAGCACTTAGGTTTTCCTGTTGAGATGGG6GACTGAGA6ACAGGACTAGCTGGAT 

30 TTCCTAGGCTGACTAAGAATCCCTAAGCCTAGCTGG 



(2) INFORMATIONS POUR LA SEQ ID NO:28: 

(i) CARACTERISTIQUES DE LA SfiQUENCE: 

(A) LONGUEUR: 3372 paires de bases 
35 (B) TYPE: nucleotide 

(C) NOMBRE DE BRIN5: simple 

(D) CONFIGURATION: linSaire 

(ii) TYPE DE MOLECULE: ADN. 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO:28: 
40 GACTTCCCAA ATACCAGAGG AAGCAGAGTG 6TTTACAGTC CTGGACCTTC AGGATGCCTT 60 



CTTCTGCATC CCTGTACATC CTGACTCTCA ATTCTTGTTT GCCTTTGAAG ATACTTCAAA 120 



CCCAGCATCT CAACTCACCT GGACTATTTT ACCCCAAGGG TTCAGGGATA GTCCCCATCT 180 
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ATTTGGCCAG GCATTAGCCC AAGACTTGAG CCAATCCTCA TACCTGGACA CTTGTCCTTC 240 
GGTAGGTGGA TGATTTACTT TTGGCCGCCC ATTCAGAAAC CTTGTGCCAT CAAGCCACCC 300 
AAGCGCTCTT CAATTTCCTC GCTACCTGTG GCTACATGGT TT.CCAAACCA AAGGCTCAAC 360 
TCTGCTCACA GCAGGTTACT TAGGGCTAAA ATTATCCAAA GGCACCAGGG CCCTCAGTGA 420 
GGAACACATC CAGCCTATAC TGGCTTATCC TCATCCCAAA ACCCTAAAGC AACTAAGGGG 480 
ATTCCTTGGC GTAATAGGTT TCTGCCGAAA ATGGATTCCC AGGTATGGCG AAATAGCCAG 540 
GTCATTAAAT ACACTAATTA AGGAAACTCA GAAAGCCAAT ACCCATTTAG TAAGATGGAC 600 
AACTGAAGTA GAAGTGGCTT TCCAGGCCCT AACCCAAGCC CCAGTGTTAA GTTTGCCAAC 660 
AG6GCAAGAC TTTTGTTCAT ATGTCACAGA AAAAACAGGA ATAGCTCTAG GAGTCCTTAC 720 
ACAGATCCGA 6GGATGAGCT TGCAACCTGT G6CACACCTG ACTAAGGAAA TTGAT6TAGT 780 
GGCAAAGGGT TGACCTCATT GTTTACGGGT AGTGGTGGCA GTAGCAGTCT TAGTATCTGA 840 
AGCAGTTAAA ATAATACAGG GAAGAGATCT TACTGTGTGG ACATCTCATG ATGTGAATGG 900 
CATACTCACT GCTAAAGGAG ACTTGTGGCT GTCAGACAAC TGTTTACTTA AATGTCAGGC 960 
TCTATTACTT GAAGGGCCAG T6CTGC6ACT GTGCACTTGT GCAACTCTTA ACCCAGCCAC 1020 
ATTTCTTCCA GACAAT6AAG AAAAGATAAA ACATAACTGr CAACAAGTAA TTTCTCAAAC 1080 
CTATGCCACT CGAGGGGACC TTTTAGAGGT TCCTTTGACT GATCCCGACC TCAACTTGTA 1140 
TACTGATGGA AGTTCCTTTG TAGAAAAAGG ACTTCGAAAA GT6GGGTATG CAGTGGTCAG 1200 
TGATAATGGA ATACTT6AAA GTAATCCCCT CACTCCAGGA ACTAGTGCTC AGCTAGCAGA 1260 
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ACTAATAGCC CTCACTTGGG CACTAGAATT AGGAGAAGAA AAAAGGGCAA ATATAATACA 1320 
GACTCTAAAT ATGCTTACCT AGTCCTCCAT GCCCATGCAG CAATATGGAA AGAAAGGGAA 1380 

5 

TTCCTAACTT CTGAGAGAAC ACCTATCAAA CATCAGGAAG CCATTAGGAA ATTATTATTG 1440 
GCTGTACAGA AACCTAGAGA GGTGGCAGTC TTACACTGCC 6GGGTCATCA CAAAGGAAAG 1500 
10 GAAAGGGAAA TACAAGAGAA CTGCCAAGCA TATATTGAAG CCAAAAGAGC TGCAAGGCAG 1560 
GACCCTCCAT TAGAAATGCT TATTAAACTT CCCTTAGTAT AGGGTAATCC CTTCCGGGAA 1620 
ACCAAGCCCC AGTACTCAGC AGGAGAAACA GAATGGGGAA CCTCACGAGG CAGTTTTCTC 1680 

15 

CCCTCGGGAC GGTTAGCCAC TGAAGAAGGG AAAATACTTT TGCCTGCAAC TATCCAATGG 1740 
AAATTACTTA AAACCCTTCA TCAAACCTTT CACTTAGGCA TCGATAGCAC CCATCAGATG 1800 
20 GCCAAATCAT TATTTACTGG ACCAG6CCTT TTCAAAACTA TCAAGCAGAT AGTCAGGGCC 1860 
TGTGAAGTGT GCCAGAGAAA TAATCCCCTG CCTTATCGCC AAGCTCCTTC AGGAGAAGAA 1920 
AGAACAGGCC ATTACCCTGG AGAAGACTGG CAACTGATTT TACCCACAAG CCCAAACCTC 1980 

25 

AGGGATTTCA GTATCTACTA GTCTGGGTAG ATACTTTCAC GGGTTGGGCA GAGGCCTTCC 2040 
CCTGTAGGAC AGAAAAGGCC CAAGAGGTAA TAAAGGCACT AGTTCATGAA ATAATTCCCA 2100 
30 6ATTCGGACT TCCCCGAGGC TTACAGAGTG ACAATAGCCC TGCTTTCCAG GCCACAGTAA 2160 
CCCAGGGAGT ATCCCAGGCG TTAGGTATAC GATATCACTT ACACTGCGCC TGAAGGCCAC 2220 
AGTCCTCA6G GAAGGTCGAG AAAATGAATG AAACACTCAA AGGACATCTA AAAAAGCAAA 2280 

35 

CCCAGGAAAC CCACCTCACA TGGCCTGTTC TGTTGCCTAT AGCCTTAAAA AGAATCTGCA 2340 
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ACTTTCCCCA AAAAGCAGGA CTTAGCCCAT ACGAAATGCT GTATGGAAGG CCCTTCATAA 2400 
CCAATGACCT TGTGCTTGAC CCAAGACAGC CAACTTAGTT GCAGACATCA CCTCCTTAGC 2460 
CAAATATCAA CAAGTTCTTA AAACATTACA AGGAACCTAT CCCTGAGAAG AGGAAAAGAA 2520 
TATTCCACCC AAGTGACATG GTATTAGTCA AGTCCCTTCC CTCTAATTCC CCATCCCTAG 2580 
ATACATCCTG GGAAGGACCC TACCCAGTCA TTTTATCTAC CCCAACTGCG GTTAAAGTGG 2640 
CTGGAGTGGA GTCTTGGATA CATCACACTT GAGTCAAATC CT6GATACTG CCAAAGGAAC 2700 
CTGAAAATCC AGGAGACAAC GCTAGCTATT CCTGTGAACC TCTAGAGGAT TTGCGCCTGC 2760 
TCTTCAAACA ACAACCAGGA GGAAAAATCG AAGCTGTAAA ACTACAAAT6 GAGCCCAAGA 2820 
TGCAGTCCAA GACTAAGATC TACCGCAGAC CCCTGGACCG GCCTGTTAGC CCACGATCTG 2680 
ATGTTAATGA GATCAAAGGC ACCCCTCCTG AGGAAATCTC AGCTGCACAA CCTCTACTAC 2940 
6CCCCAATTC AGCAGGAAGC AGTTAGAGC6 GTCGTCGGCC AACCTCCCCA ACAGCACTTA 3000 
GGTTTTCCTG TTGAGATGGG GGACTGAGAG ACAGGACTAG CTGGATTTCC TAGGCTGATT 3060 
AAGAATCCCT AAGCCTAGCT GGGAAGGTGA CCACATCCAC CTTTAAACAC GGGGCTTGCA 3120 
ACTTAGCTCA CACCTGACCA ATCAGAGAGC TCACTAAAAT GCTAATTAGG CAAAGACAGG 3180 
A6GTAAAGAA ATAGCCAATC ATTTATTGCC TGAGAGCACA GCAGGAGGGA CAATGATCGG 3240 
GATATAAACC CAAGTTTTCG AGCCGGCAAC GGCAACCCCC TTTGGGTCCC CTCCCTTTGT 3300 
ATGGGAGCTC TGTTTTCATG CTATTTCACT CTATTAAATC TTGCAACTGC AAAAAAAAAA 3360 
AAAAAAAAAA AA 3372 
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(2) INFORMATIONS POUR lA 5EQ ID NO:29: 
5 (i) CARACTERISTIQUES D£ UK S£qUGNCE: 

(A) LONGUEUR: 2372 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
{D) CONFIGURATION: lineaire 

10 (ii) TyPE DE MOLECULE: ADN. 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 29: 
ACTGCACTCT TCTGGTCCAT GTTTCTTAC6 GCTCGAGCTG AGCTTTTGCT CACCGTCCAC 60 

CACTGCTGTT TGCCACCACC GCAGACCTGC CGCTGACTCC CATCCCTCTG GATCCTGCAG 120 

15 

GGTGTCCGCT GTGCTCCTGA TCCAGCGAGG CGCCCATTGC CGCTCCCAAT TGGGCTAAAG 180 

GCTTGCCATT GTTCCTGCAC GGCTAAGTGC CTGGGTTTGT TCTAATTGAG CTGAACACTA 240 

20 ATCACTGGGT TCCATGGTTC TCTTCTGTGA CCCACGGCTT CTAATAGAAC TATAACACTT 300 

ACCACATGGC CCAAGATTCC ATTCCTTGGA ATCC6TGA6G CCAAGAACTC CA6GTCAGAG 360 

AATACGAGGC TTGCCACCAT CTTGGAAGCG GCCTGCTACC GTCTTGGAAG TGGTTCACCA 420 

25 

CCATCTT6GG AGCTCTGTGA GCAAGGACCC CCCGGTAACA TTTTG6CAAC CAACGACGGA 480 

CATCCAAAGT GATGGGAAAC GTTCCCCGCA AGACAAAAAC GCCCCTAAGA CGTATTCTGG 540 

30 AGAATTGGGA CCAATTTGAC CCTCAGACAC TAAGAAAGAA ACGACTTATA TTCTTCTGCA 600 

GTGCCGCCTG 6CACTCCTGA GGGAAGTATA AATTATAACA CCATCTTACA GCTAGACCTC 660 

TTTTGTAGAA AAG6CAAAT6 GAGTGAAGTG CCATAAGTAC AAACTTTCTT TTCATTAAGA 720 

35 

GACAACTCAC AATTATGTAA AAAGTGTGAT TTATGCCCTA CAGGAAGCCT TCAGAGTCTA 780 
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CCTCCCTATC CCAGCATCCC CGACTCCTTC CCCAACTAAT AAGGACCCCC CTTCAACCCA 840 
AATGGTCCAA AAGGAGATAG ACAAAAGGGT AAACAGTGAA CCAAAGAGTG CCAATATTCC 900 
CCAATTATGA CCCCTCCAAG CAGTGGGAGG AAGAGAATTC GGCCCAGCCA GAGTGCATGT 960 
GCCTTTTTCT CTCCCAGACT TAAAGCAAAT AAAAACAGAC TTAGGTAAAT TCTCAGATAA 1020 
CCCTGATGGC TATATTGATG TTTTACAAGG GTTAGGACAA TTCTTTGATC TGACATGGAG 1080 
AGATATAATG TCACTGCTAA ATCAGACACT AACCCCAAAT GAGAGAAGTG CCACCATAAC 1140 
TGCAGCCTGA GGGTTTGGCG TCTCTGGTAT CTCAGTCAGG TCAATGGATA NGGATGACAA 1200 
CAGAA6GAAA GAHAATGATT CCCCACAGGC CAGCAGGCAG TTCCCAGTCT AGACCC7CAT 1260 
TGGGACACAG AATCAGAACA TGGAGATT6G TGCTGCAGAC ATTTGCTAAC TTGTGTGCTA 1320 
GAAGGACTAA GGAAAACTAG GAAGAAGTCT ATGAATTACT CAATGATGTC CACCATAACA 1380 
CAGGGAAG6G AAGAAAATCC TACTGCCTTT CTGGAGAGAC TAAGGGAGGC ATTGAGGAAG 1440 
CGTGCCTCTC TGTCACCTGA CTCTTCTGAA GGCCAACTAA TCTTAAAGCG TAAGTTTATC 1500 
ACTCAGTCAG CTGCAGACAT TAGAAAAAAC TTCAAAAGTC TGCCGTAGGC CCGGAGCAAA 1560 
ACTTAGAAAC CCTATTGAAC TTGGCAACCT CGGTTTTTTA TAATAGAGAT CAGGAGGAGC 1620 
AGGCGGAACA GGACAAACGG GATTAAAAAA AAGGCCACCG CTTTAGTCAT GACCCTCAGG 1680 
CAAGTGGACT TTGGAGGCTC TGGAAAAGGG AAAAGCTGGG CAAATTGAAT GCCTAATAGG 1740 
GCTTGCTTCC AGTGCGGTCT ACAAGGACAC TTTAAAAAAG ATTGTCCAAG TAGAAGTAAG 1800 
CCGCCCCTTC GTCCATGCCC CTTATTTCAA GGGAATCACT GGAAGGCCCA CTGCCCCAGG 1860 
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GGACAAAGGT CTTTTGAGTC AGAAGCCACT AACCAGATGA TCCAGCAGCA GGACTGAGGG 1920 
TGCCTGGGGC AAGCGCCATC CCATGCCATC ACCCTCACAG AGCCCTGGGT ATGCTTGACC 1980 

5 

ATT6AGGGCC AGGAAGGTTG TCTCCTGGAC ACTGGTGCGG TCTTCTTAGT CTTACTCTTC 2040 
TGTCCCGGAC AACTGTCCTC CAGATCTGTC ACTATTCT6A GGGGGTCCNT AAGACGGGCA 2100 
10 GTCACTAGAT ACTTTTTCCC AGCCACTAAG TTATGAACTG GGGAGCTTTA TTCTTTTCAC 2160 
ATGCTTTTCT AATTATGCTT GAAAGCCCCA CTACCTTGTT AGGGAGAGAC ATTCTAGCAA 2220 
AAGCAGGGGC CATTATACAC CTGAACATAG GAGAAGGAAC ACCCGTTTGT TGTNCCCCTG 2280 

IS 

CTTGAGGAAG GAATTAATCC TGAAGTCT66 GCAACAGAAG GACAATATGG ACGAGCCAAA 2340 
GAATGCCCGT CCTGTTCAAG TTAAACTAAA GG 2372 

20 

(2) INFORMATIONS POUR LA SEQ ID NO: 30: 

(i) C3U<ACTERISTIQUES DE LA SfiQUENCE: 

(A) LONGUEUR: 7582 paires de bases 

(B) TYPE: nucl6otide 

25 (C) NOHBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: AON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 30: 
CAACAATCGG GATATAAACC CAGGCATTCG AGCTGGCAAC AGCAGCCCCC CTTTGGGTCC 60 

30 CTTCCCTTTG TATGGGAGCT GTTTTCATGC TATTTCACTC TATTAAATCT TGCAACTGCA 120 
CTCTTCTGGT CCATGTTTCT TACGGCTCGA GCTGAGCTTT TGCTCACCGT CCACCACTGC 180 
TGTTTGCCAC CACCGCANAC CTGCCGCTGA CTCCCATCCC TCTGGATCCT GCAGGGTGTC 240 
CGCTGTGCTC CTGATCCAGC GARGCGCCCA TTGCCGCTCC CAATTGGGCT AAAGGCTTGC 300 
CATTGTNCCT 6CACGGCTAA GTGCCTGGGT TTGTTCTAAT TGAGCTGAAC ACTANTCACT 360 

35 GGGTTCCATG GTTCTCTTCT GTGACCCACG GCTTCTAATA KAACTATAAC ACTTACCACA 420 
TGGCCCAAGA TTCCATTCCT TGGAATCCGT GAGGSCAACG AACTCCAGGT CAGAGAATAC 480 



45 



GARGCTTGCC ACCATCTTGG AAGCGGCCTG CTACCRTCTT GGAAGTGGTT CACCACCATC 540 
TTGGGAGCTC TGTGAGCAAG GACCCCCCGG TRACATTTT6 GCRACCAMSR ACGGACATCC 600 
MAAGTGATGG GAAACGTTCC CCGCAAGACA AAAACGCCCC TAAGACGTAT TCTGGARAAT 660 
TGGGAMCAAT TTGACCCTCA GACACTAAGA AAGAAACGAC TTATATTCTT CTGCAGTGCC 720 
GCCTGGCACT CCTGAGGGAA GTATAAATTA TAACACCATC TTACAGCTAG ACYTCTTTTG 780 
TAGAAAAGGC AAATGGAGTG AAGTGCCATA AGTACAAACT TTCTTTTCAT TAAGAGACAA 840 
CTCACAATTA TGTAAAAAGT GTGATTTATG CCCTACAGGA AGCCTTCAGA GTCTACCTCC 900 
CTATCCCAGC ATCCCCGACT CCTTCCCCAM TTAATAAGGA CCCCCCTTCA ACCCAAATGG 960 
TCCAAAAGGA GATAGACAAA AGGGTAAACA GTGAACCAAA GAGTGCCAAT ATTCCCCAAT 1020 
TATGACCCCT CCCAAGCAGT GGGAGGAAGA GAATTCGGCC CAGCCAGAGT GCATGTGCYT 1080 
TTTYYTCrrCC CAGACTTAAA GCAAATAAAA ACAGACTTAG GTAAATTCTC AGATAAYCCT 1140 
GATGGCTATA TTGRTGTTTT ACAAGGGTTA GGACAATTCT TTGATCTGAC ATGGAGAGAT 1200 
ATATATGTCA CTGCTAAATC AGACACTAAC CCCAAATGAG AGAAGTGCCA CCATAACTGC 1260 
AGCCTGAGRG TTTGGCGATC TCTGGTATCT CAGTCAGGTC AATGGATANG GATGACAACA 1320 
GAAGGAAAGA NAATGATTCC CCACAGGCCA GCARGCAGTT CCCAGTCTAS ACCCTCATTG 1380 
GGGACACAGA AATCAGTAAC ATGGGA6ATT GGTGCTGCAG ACATTTGCTA ACTTGTGTGC 1440 
TASAAGGACT AAGGAAAACT ASGAAGAAAR TCTAYGAATT ACTCAATGAT GTCCACCATA 1500 
ACACAGGGGA AGGGAAGAAA ATCCTACTGC CTTTCTGGAG AGACTAAGGG AGGCATTGAG 1560 
GAAGCGTGCC TCTCTGTCAC CTGACTCTTC TGAAGGCCAA CTAATCTTAA AGCGTAAGTT 1620 
TATCACrCAG TCAGCTGCAG ACATTAGAAA AAACTTCAAA AGTCTGCCGT A6GCCCGGAG 1680 
CAAAACTTAG AAACCCTATT GAACTTGGCA ACYTCGGTTT TTTATAATAG AGATCAGGAG 1740 
GAGCAGGCGG AACAGGACAA ACGGG^^TTAA AAAAAAGGCC ACCGCTTTAG TCATGACCCT 1800 
CAGGCAAGTG GACTTTGGAG GCTCTGGAAA AGGGAAAAGC TGGGCAAATT GAATGCCTAA 1860 
TAGGGCTTGC TTCCAGTGCG GTCTACAAGG ACACTTTAAA AAAGATTGTC CAAGTAGAAG 1920 
TAAGCCGCCC CTTCGTCCAT GCCCCTTATT TCAAGGGAAT CACTGGAAGG CCCACTGCCC 1980 
CAGGGGACAA AGGTCTTTTG AGTCAGAAGC CACTAACCAG ATGATCCAGC AGCAGGACTG 2040 
AGGGTGCCTG GGGCAAGCGC CATCCCATGC CATCACCCTC ACAGAGCCCT GGGTATGCTT 2100 
GACCATTGAG GGCCAGGAAG GTTGTCTCCT GGACACTGGT GCGGTCTTCT TAGTCTTACT 2160 
CTTCTGTCCC GGACAACTGT CCTCCAGATC TGTCACTATT CTGAGGGGGT CCNTAAGACG 2220 
GGCAGTCACT AGATACTTTY TCCCAGCCAC TAAGTTATGA ACTGGGGAGC TTTATTCTTT 2280 
TCACATGCTT TTCTAATTAT GCTTGAAAGC CCCACTACCT TGTTAGGGAG AGACATTCTA 2340 
GCAAAAGCAG GGGCCATTAT ACACCTGAAC ATAGGAGAAG GAACACCCGT TTGTTGTNCC 2400 
CCTGCTTGAG GAAGGAATTA ATCCTGAAGT CTGGGCAACA'GAAGGACAAT ATGGACGAGC 2460 
CAAAGAATGC CCGTCCTGTT CAAGTTAAAC TAAAGGATTC CACTTCCTTT CCCTACCAAA 2520 
GGCAGTACCC CCTCAGACCC AAGGCCCAAC AAGGATTCCA AAAGATTGTT AAGGACTTAA 2580 
AAGCCCAAGG CTTAGTAAAA CCATGCATAA CTCCCTGCAG TAATTCCGTA GTGGATTGAG 2640 
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GAG6CACAGA AACCCAGTGG ACAGTGGAGG 
A6GCCGTTGT CCTTTTATAC CCAGCTGTAC 
CAGAGGAAGC AGAGTGGTTT ACASTCCTGG 
TACATCCTGA CTCTCAATTC TTGTTTGCCT 
5 TCACCTGGAC TBTTTTACCC CAAGGGTTCA 
TAGCCCAAGA CTTGAGYCAR TYMTCATACC 
ATTTACTTTT RGCYGCCYRT TCAGAAACCT 
ATTTCCTCGC YACCTGTGGC TACAWGGTTT 
AGGTTAAATA CTTAGGRCTA ARATTATCCA 

10 TCCAGCCTAT ACTGGCTTAT CCTCATCYCA 
GCRTAAYAGG YTTCTGCCGA AWATGGATTC 
WATACASTAA TTAAGGAAAC TCAGAAAGCC 
GYMRAAGTGG CTTTCCAG6C CCCTAAAGAA 
TGCCAACRGG GCAAGACTTT TSTTYATAYR 

15 GTCCTTACAC AGRTCCRAGG 6AY6AGCTT6 
GATGTAGTGG CAAAGGGTTG RCYTCATTGT 
GTATCTGAAG CAGTTAAAAT AATACAGGGR 
GTGAAYRGCA TACTCACTGC TAAAGGAGAC 
TRTCAGGCTC TATTACTTGA ARGGCCAGTG 

20 CCAGYCNCAT TTCTTCCAGA CAATGAAGAA 
TCTCAAACCT AT6CCACTCG AGGGGACCTT 
CAACTTGTAT ACTGATGGAA GTTCCTTTGT 
AGTGGTCAGT GATAATGGAA TAYTTGAAAG 
GCTRGCAGAA CTAATAGCCY TCAYTKGGGC 

25 TATATATACA GACTCTRART ATGCTYACCT 
AGAAAGGGAA TTCCTAACTT CYGAGRGAAC 
ATTATTAYTG GCWGTACAGA AACCTABAGA 
NAAAGGAAAG RAAAGGGAAA TASAAGRGAA 
TGCAAGGCAG GACCCTCCAT TAGAAATGCT 

30 CTTCCGGGAA ACCAA6CCCC AGTACTCA6C 
CAGTTTTCTC CCCTCGGGAC GGTTAGCCAC 
TATCCAATGG AAATTACTTA AAACCCTTCA 
CCATCARATG GCCAAATCAT TATTTACTGG 
AKTCA6GGCC TGTGAAKTGT GCCARARAAA 

35 AGGARAACAA ARAACAGGCC ATTACCCTGR 
CCCAAACCTC AGGGATTTCA GTATCTACTA 



GTTAGTGCAA GATCTCAGGA TTATCAATGG 2700 
CTAGCCCTTA TACTGTGMYT TCCCAAATAC 2760 
ACCTTMAGGA TGCCTTCTTC TGCATCCCTG 2820 
TTGAAGATAC TTCAAACCCA RCATCTCAAC 2880 
GGGATAGYCC CCATCTATTT GGCCAGGCAT 2940 
TGGACACTCT TGTCCTTCRG TAKGTGGATG 3000 
TGTGCCATCA AGCCACCCAA GCRCTCTTMA 3060 
CCAAAC5ARA RGCTCARCTC TGCTCACAGC 3120 
AAGGCACCAR GGCCCTCAGT GAGGAAYRYA 3180 
AAACCCTAAA GCAACTAAGR GRRTTCCTTG 3240 
CCCAGGTWTG GCRAAATAGC CAGGYCATTA 3300 
AATACCCATT TARTAAGATG GAYAMCTGAA 3360 
GGCCTTAAAC CCAAGYCCCA GTGTTAAGYT 3420 
TCACAGAAAA AAACAGRAAY AGCTCTRGGA 3460 
CAACCYRTGG CRYACCTGAS TAAGGAAAYT 3540 
TTAYGGGTAG TGGTGGCA6T AGCAGTYKTA 3600 
AGAGATCTTA CTGTGTGGAC ATCTCATGAK 3660 
TTGTGGCTGT CAGACAACYG TTTACTTAAA 3720 
CTGCRACT6T GCACTTGTGC AACTCTTAAC 3780 
AAGATARAAY ATAACTGTCA ACAARTAATT 3840 
YTAGARGTTC CYTTGACTGA TCCYGACCTT 3900 
AGAAAAAGGA CTTCGAAAAG Y6GGGTATGC 3960 
TAATCCCCTC ACTCCAGGAA CTAGTGCTYA 4020 
ACTAGAATTA GGAGAAGRAA AAAGGGYAAA 4080 
AGTCNTCCAT GCCCATGMRG CAATATGSAR 4140 
ACCTATCAMA CATCAGGAAG CCATTAGGAR 4200 
GGTGGMAGTC TTACACTGCY GGGGTCATCA 4260 
YTGCCAAGCA KATATTGAAG CKAAAAGAGC 4320 
TATTAAACTT CCCTTAGTAT AGGGTAATCC 4380 
AGGAGA^ACA GAATGGGGAA CCTCACGAGG 4440 
TGAAGAAGGG AAAATACTTT TGCCTGCAAC 4500 
TCAAACCTTT CACTTAGGCA TCGATAGCAC 4560 
ACCAGGCCTT TTCAAAACTA TCAAGCARAT 4620 
TAATCCCCTG CCTYATCGCC AAGCTCCTTC 4680 
ARAARACTGG CAACTGATTT TACCCACAAG 4740 
GTCTGGGTAR ATACTTTCAC GGGTTGGGCA 4800 
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RAGGCCTTCC CCTGTAGGAC AGAAAAGGCC CAAGAGGTAA TAAAGGCACT AGTTCATGAA 4860 
ATAATTCCCA GATTCGGACT TCCCCGAGGC TTACAGAGTG ACAATAGCCC TGCTTTCCAG 4920 
GCCACAGTAA CCCAGGGAGT ATCCCAGGCG TTAGGTATAC 6ATATCACTT ACACTGCGCC 4 980 
TGAAGGCCAC AGTCCTCAGG GAAGGTCGAG AAAATGAATG AAAYACTCAA AGGACATCTA 5040 
AAAAAGCAAA CCCAGGAAAC CCACCTCACA TGGCCTGYTC TGTTGCCTAT AGCCTTAAAA 5100 
AGAATCTGCA ACTTTCCCGA AAAAGCAGGA CTTAGCCCAT AC6AAATGCT GTAT6GAAGG 5160 
CCCTTCATAA CCAATGACCT TGTGCTTGAC CCAAGACAGC CAACTTAGTT GCAGACATCA 5220 
CCTCCTTAGC CAAATATCAA CAAGTTCTTA AAACATTACA AGGAACCTAT CCCT6AGAAG 5280 
AGGGAAAAGA ACTATTCCAC CCWWGTGACA TGGTATTAGT CAAGTCCCTT CYCTCTAATT 5340 
CCCCATCCCT AGATACATCC TGGGAAGGAC CCTACCCAGT CATTTTATYT ACCCCAACTG 5400 
CGGTTAAAGT GGCTGGAGTG GAGTCTTGGA TACATCACAC TTGAGTCAAA TCCTGGATAC 5460 
TGCCAAAGGA ACCTGAAAAT CCAGGAGACA ACGCTAGCTA TTCCTGTGAA CCTCTAGAGG 5520 
ATTTGCGCCT GCTCTTCAAA CAACAACCAG GAGGAAAGTA ACTAA7ATCA TAAATCCCCC 5580 
ATGGSCCTCC CTTATCATAT TTTTCTCTKT ASTGTTSTTT YACCCTSTTT CACTCTCACT 5640 
GCACCCCCTC CATGCCGCTG TATGACCAGT AGCTCCCCTY ACCMAGAGTT TCTATGGAGA 5700 
ATGCAGCGTC CCGGAAATAT TGATGCCCCA TCGTATAGGAG TCTTTSTAAG GGAACCCCC 5760 
ACCTTCACTG CCCACACCCA TATGCCCCGC AACTGCTATC ACTCTGCCAC TCTTTGCATG 5820 
CATGCAAATA CTCATTATTG GACAGGAAAA ATGATTAATC CTAGTTGTCC TGGAGGACTT 5880 
GGAGTCACTG TCTGTTGGAC TTACTTCACC CAAACTGGTA TGTCTGATGG GGGT6GAGTT 5940 
CAAGATCAGG CAAGAGAAAA ACATGTAAAA GAAGTAATCT CCCAACTCAC CSGGGTACAT 6000 
GGCy^CTCTA GCCCCTACAA AGGACTAGAT CTCTCAAAAC TACATGAAAC CCTCCGTACC 6060 
CATACTCGCC TGGTAAGCCT ATTTAATACC ACCCTCACTG GGCTCCATGA GGTCTCGGCC 6120 
CAAAACCCTA CTAACTGTTG GATATGCCTC CCCCTGAACT TCARGCCATA TGTTTCAATC 6180 
CCTGTACCTG AACAATGGAA CAACTTCAGC ACAGAAATAA ACACCACTTC CGTTTTAGTA 6240 
GGACCTCTTG TTTCCAATST GGAAATAACC CATACCTCAA ACCTCACCTG TGTAAAATTT 6300 
AGCAATACTA CATACACAAC CAACTCCCAA TGCATCAGGT GGGTAACTCC TCCCACACAA 6360 
ATAGTCTGCC TACCCTCAGG AATATTTTTT GTCTGTGGTA CCTCAGCCTA TCGTTGTTTG 6420 
AATGGCTCTT CAGAATCTAT GTGCTTCCTC TCATTCTTAG TGCCCCCYAT 6RCCATCTAC 6480 
ACTGAACAAG ATTTATACAG TTATGTCATA TCTAAGCCCC GCAACAAAAG AGTACCCATT 6540 
CTTCCTTTTG TTATAGGAGC AGGAGTGCTA GGTGCACTAG GTACTG6CAT TGGCGGTATC 6600 
ACAACCTCTA CTCAGTTCTA CTACAAACTA TCTCAAGAAC TAAATGGGGA CATGGAACGG 6660 
GTCGCCGACT CCCTGGTCAC CTTGCAAGAT CAACTTAACT CCCTAGCAGC AGTAGTCCTT 6720 
CRAAATCGAA GAGCTTTAGA CTYGCTAACC GCTGARAGAG GGGGAACCTG TTTATTTTTA 6780 
GGGGAAGAAT GCTGTTATTA TGTTAATCAA TCCGGAATCG TCACTGAGAA AGTTRAAGAA 6840 
ATTCSAGATC GAATACAACG TAKAGCAGAR GAGCTTCGAA ACACTGGACC CTGGGGCCTC 6900 
CTCAGCCRAT GGATGCCCTG GATTCTCCCC TTCTTAGGAC CTCTAGCAGC TATAATATTG 6960 
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CTACTCCTCT 


TTGGACCCTG 


TATCTTTRAC 


GAAGCTGTRA 


AACTACAAAT 


GGAGCCCAAG 


CCCCTGGACC 


GGCCTGYTAG 


CCCACGATCT 


GA6GAAATCT 


CAGCTGCACA 


ACCTCTACTA 


GGTSGTCGGC 


CAACCTCCCC 


AACAGCACTT 


GACAGGACTA 


GCTGGATTTC 


CTAGGCTGAY 


ACCACATCCA 


CCTTTAAACA 


CGGGGCTTGC 


CTCACTAAAA 


TGCTAATTAG 


GCAAAGACAG 


MTGAGAGCAC 


AGCAGGAGGG 


ACAATGATCG 


CGGCAACCCC 


CTTTGGGTCC 


CCTCCCTTTG 


TCTATTAAAT 


CTTGCARCTG 


CR 



CTCCTTGTTA ACTTTGTCTC TTCCAGAATC 7020 
ATGCAGTCCA AGACTAAGAT CTACCGCAGA 7080 
GATGTTAATG ACATCAAAGG CACCCCTCCT 7140 
CGCCCCAATT CAGCAGGAAG CAGTTAGAGC 7200 
AGGTTTTCCT GTTGAGATGG GGGACTGAGA 7260 
TAAGAATCCY TAAGCCTAGS TGGGAAGGTG 7320 
AACTTAGYTC ACACCTGACC AATCAGAGAG 7380 
GAGGTAAAGA AATAGCCAAT CATYTATTGC 7440 
GGATATAAAC CCAAGTYTTC GAGCCGGCAA 7500 
TATGGGAGCT CTGTTTTCAT GCTATTTCAC 7560 

7582 



(2) INFORMATIONS POUR LA SEQ ID N0:3X: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
15 (A) LONGUEUR: 363 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 
(11) TYPE DE MOLECULE: ADN 

20 (Xl) DESCRIPTION DE LA SfiQUENCE: SEQ ID NO: 31: 

MGNIPPXAXT PLRCILENHD QCDTQTLRKK RFIFFCSTAH PQYPLQGRET 50 

WLPE6SINYN IILQLDLFCR XEGKWSEVPY VQTPFSLRDN SQLCRKCX^LC 100 

PTGSPQSPPP YPSVPPPTPS STNRDPPLTQ TVQKEIDK6V NNEPK5ANIP 150 

RLCPLQAVRG GEFGPARVPV PFSLSDLXQI KIDLGKFSDN PDGYIDVLQG 200 

25 LGQSFDLTWR DIHLLLNQTL TPNERSAAVT AAREFGDLWY LSQVNNRHTT 250 

EERTTPTGOQ AVPSVDPHWD TESEH6DWCH KHLLTCVLE6 LRKTRXKPMN 300 

YSMMSTITQG KEENPTAFLD RLREALRXHT SLSPDSIEGQ LILKOKFITQ 350 

SAADIRKNFK SLP 363 



30 
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Feuille avsnt rectification 



REVENDICATIONS 

1. Fragment nucleique endogene, de type 
retroviral, a I'etat isole, et integre a I'ADN du genome 
humain, ledit fragment 6tant caracterise en ce qu'il 
comprend, ou consiste en, au moins une partie du gene gag 
d'un retrovirus endogSne associ^ a une maladie auto-immune 
ou a des insuccds de grossesse ou pathologies de la 
grossesse, ladite partie au moins codant/ directement ou 
indirectement/ pour un produit d' expression, ou le 
compl6mentaire dudit fragment. 

2. Fragment selon la revendication 1, caracterise 
en ce qu'il comprend, ou consiste en, ledit g6ne gag 
entier. 

3. Fragment selon la revendication 1, caract6ris6 
en ce que la partie au moins code pour la matrice et la 
capside. 

4. Fragment selon la revendication 1, caract§ris4 
en ce qu'il coraprend SEQ ID N0:1/ SEQ ID NO: 2, 
SEQ ID NO: 3, ou le complement aire de I'une quelconque 
desdites sequences. 

5. Fragment selon la revendication 1, caracterise 
en ce qu'il consiste en SEQ ID N0:1, SEQ ID NO: 2, 
SEQ ID NO: 3/ ou le compiementaire de I'une quelconque 
desdites sequences. 

6. Fragment selon la revendication 1, caracterise 
en ce qu'il est localise sur au moins I'un des chromosomes 
humain 1, 3, 6, 7 et 16. 

7. Fragment selon la revendication 6, caracterise 
en ce qu'il est localise sur au moins le chromosome 3. 

8. Fragment selon la revendication 1, caracterise 
en ce que le produit d' expression est de I'ARN messager. 

9. Fragment selon la revendication 1, caracterise 
en ce que le produit d' expression est immunologiquement 
reconnu par des anticorps presents dans un echantillon 
biologique d'un patient atteint d'une maladie auto-immune. 
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10. Fragment selon la revendication 9, caracterise 

en ce que 1' 6chantillon biologique est un fluide 
biologique choisi parmi le s§rum, le plasma, le liquide 
synovial et 1' urine. 
5 11. Fragment selon la revendication 9, caracteris6 

en ce que la * maladie auto-imxnune est la sclerose en 
plaques . 

12. Produit de transcription endog^ne, k l'6tat isole, 
susceptible d'etre obtenu par transcription d'au moins 

10 ladite partie du g6ne gag d'un fragment selon I'une 
quelconque des revendications 1 d 11. 

13. Procede de detection de sequences nuclSotidiques 
endogenes appartenant a un fragment tel que defini selon 
I'une des revendications 1 a 11, caracterise en ce que : 

15 - on effectue au pr^alable une 6tape d' extraction de 
I'ADN cellulaire d'un tissu ou fluide biologique, on 
realise au moins un cycle d' amplification de I'ADN 
cellulaire, telle que par PCR, au moyen d' amorces 
notamment choisies parmi SEQ ID NO: 4 k SEQ ID NO: 9 et 

20 SEQ ID NO : 12 a SEQ ID NO :17, 

- on met en contact I'ADN cellulaire present dans 
I'^chantillon avec une sonde d6terminee susceptible de 
s'hybrider avec un fragment tel que defini precedemment 
et de former un complexe d' hybridation, ladite sonde 

25 comprenant au moins 15 nucleotides, de preference 17 et 
avantageusement 19 nucleotides contigus de SEQ ID NO : 3 
ou consistant en SEQ ID NO :3, dans des conditions 
appropriees permettant 1' hybridation, en particulier 
dans des conditions de forte stringence, et 

30 - on detecte les complexes d' hybridation formes par tout 
moyen approprie. 

14. Procede selon la revendication 13, caracterise 
en ce que la sonde est marquee par un traceur, tel que par 
exemple un traceur radioactif ou une enzyme. 

35 
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15 • Proc6d§ de detection de sequences 

nucl6otidiques endogenes appartenant a un fragment tel que 
d6fini selon I'une des revendications 1 a 11, caracteris6 
en ce que : 

5 - on effectue au prSalable une ^tape d' extraction de I'ADN 
cellulaire d'un tissu ou fluide biologique/ eventuellement 
issu de chromosomes isoles/ on realise au moins un cycle 
d' amplification de I'ADN cellulaire^ telle que par PGR, au 
moyen d' amorces notamment choisies parrai SEQ ID N0:4 a 
10 SEQ ID NO: 9 et SEQ ID NO :12 a SEQ ID NO ill, 

- on effectue une 6tape de transcription / traduction in 
vitro du produit amplifie, et 

- on fait r6agir le produit issu de l'6tape de 
transcription / traduction avec un s6rum ou plasma d'un 

15 patient pr6sentant une maladie auto-immune- 

16. Procede pour 1' etude et/ou le suivi d'une 
proliferation cellulaire des cellules T in vitro selon 
lequel on met en contact les cellules T d'un patient avec 
soit des produits de transcription / traduction (SEQ ID 

20 NO :31), tels qu'obtenus selon le proc§d6 de la 
revendication 15, soit des peptides de synthase derives de 
ou appartenant a SEQ ID NO :31. 

17. Precede de marquage mol^culaire in situ de 
chromosomes isoles de patients dans lequel on utilise une 

25 sonde marquee, par tout traceur appropri6/ comprenant tout 
ou partie de SEQ ID NO :3. 

18. Protfeine recombinante obtenue a partir d'une 
cassette d' expression dans un hote bacterien caracterisee 
en ce que sa sequence prot§ique consiste en SEQ ID NO :31. 

30 19* Proteine, selon la revendication 18, 

caracterisee en ce que I'hote bacterien est E. coli. 
20. React if pour la detection d'une maladie auto- 

immune ou un suivi de grossesse comprenant au moins un 
fragment selon I'lane quelconque des revendications 1 ^ 11 

35 ou une prot6ine selon les revendications 16, 18 et 19. 



52 



21. Utilisation d'un fragment selon I'une 
quelconque des revendications 1 ^ 11 ou d'une prot6ine 
selon les revendications 16, 18 et 19 pour detecter, dans 
un 6chantillon biologique/ une susceptibilite ± une 
maladie auto-immune ou un suivi de grossesse. 

22. Utilisation selon la revendication 21, 
caracteris^e en ce que la maladie auto-immune est la 
sclerose en plaques. 
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Feuille rectifiee 



REVENDICATIOHS 

1. Fragment nucleique endogSne/ de type retroviral/ 
& l'6tat isolfe/ ledit fragment 6tant caract6ris§ en ce 
qu'il comprend, ou consiste en, au moins une partie du 
gene gag d'un retrovirus endog^ne associ^ k une maladie 
auto-immune ou k des insuccSs de grossesse ou pathologies 
de la grossesse, ladite partie au moins codant, 
directement ou indirectement/ pour un produit 
d' expression, ou le compl Omental re dudit fragment. 

2. Fragment selon la revendication 1, caracteris6 
en ce qu'il comprend, ou consiste en, ledit g^ne gag 
entier. 

3. Fragment selon la revendication 1, caract6ris6 
en ce que la partie au moins code pour la matrice et la 
capside. 

4. Fragment selon la revendication 1, caract6ris6 
en ce qu'il comprend SEQ ID N0:1, SEQ ID N0:2, 
SEQ ID NO: 3, ou le complement aire de I'une quelconque 
desdites sequences. 

5. Fragment selon la revendication 1, caract§rise 
en ce qu'il consiste en SEQ ID N0:1, SEQ ID N0:2, 
SEQ ID NO: 3, ou le complement aire de I'une quelconque 
desdites sequences. 

6. Fragment selon la revendication 1, caracteris6 
en ce qu'il est localise sur au moins I'un des chromosomes 
humain 1, 3, 6, 7 et 16. 

7. Fragment selon la revendication 6, caracteris6 
en ce qu'il est localise sur au moins le chromosome 3. 

8. Fragment selon la revendication 1, caracterise 
en ce que le produit d' expression est de I'ARN messager. 

9. Fragment selon la revendication 1, caracterise 
en ce que le produit d' expression est immunologiquement 
reconnu par des anticorps presents dans un echantillon 
biologique d'un patient atteint d'une maladie auto-immune. 
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10 20 30 40 50 

1234S67890 1234567890 1234Sfi789Q 1234567690 1234567890 
CCTAGAACCT ATICK3GAGA ATTOOSAOCA ATGIGACftCT CAGftOrTAA 90 
PRTY SGE LGP M.HS DAK 
LER ILEN WDQ CDT QTLR 
.NV PWR IGTN VTL RR. 

GAAAGAAA05 AnTAXATIC TICTOC A GIA OOOQCTOCXX: ACAATA3CCT 100 
KET lYIL LQY RLA TISS 
KKR FIF FCST AWP QYP 
ERND LYS SAV PPGH NIL 

CnCA^mSA G?^GAAACnG GCTPOCIGAG OSA^^TmCAA AnATAACAT 150 

SRE RML AS.G KYK L.H 
LQGR ETW LPE GSIN YNI 
FKG EKPG FLR EV. IITS 

CAlCi'lAC»3 ClS>iXClCT TCTOIS'CfM. GGA093CAAA TOSGIGAAG 200 
HLTA RPL L.K 6GQM B.S 
ILQ LDLF CRK EGK WSEV 
SYS .TS SVER RAN GVK 

IGOCMMGT QCAAftCmC ITl'llXl'lAA GAGACAACIC ACAAU'liAIUjT 250 
AIC ANFL PIK RQL TIM. 
PYV QTF PSLR DNS QLC 
CHMC KLS PH. ETTH NYV 

AAAAft3IGIG Gi TZ A H GaOC TACA3GAA3C CCTCAG?^ CACgiariA 300 

KVW FMP YRKP SES TSL 
KKCG LCP TGS PQSP PPY 
KSV VYAL QEA LRV HLPT 

CCCCU3031C OCCXaXJUSA aOLTlXJCi C AACTAAIAftS GAaXXXMT 350 
PQRP LPD SFL N. .G PPF 
PSV PSPT PSS TNK DPPL 
PAS PPR LLPQ LIR TPL 

TMCa^iit^ <S3rCCti^^ 400 
NPN GPKG DRQ RGK Q.TK 

TQT VQK EIDK GVN NEP 
.PKR SKR R.T KG.T MNQ 

AAG?«j10ULA AaMTOODOG AH'IMGOOOC CIQMQCAG TCAGa3G?«3S 450 

ECQ YSP IMPP PSS ERR 
KSAN IPR LCP LQAV RGG 
RVP IPPD YAP SKQ. .EEE 

A3AA!n03QC: 0Ca333^ 'l UJCIGll AOC TI'IU'ICICIC la^aCTIRA 500 
RIRP SQS ACT FFSL RLK 
EFG PARV PVP FSL SDLK 
NSA QPE CLYL FLS QT. 
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UXMKTTPA PiMTCMX^ GGTAAATZCT OOVEAAOT 1G?039CTAT. 550 
AN. NRPR .IL R'.P . R h Y 
QIK IDL GKFS DNP DGY 
SKLK .T. VNS QITL TAI 

ATIGAICnT TPCMCXXjTT PaSfCfiKVCX: TTVGMCVCA CfaX33fCMjA GOO 

.CF TRV RTIL .SDMER 
IDVL QGL GQS FDLT WRD 
LMF YKG. DNP LI. HGEI 

TATAArcrm CXACTAAAIC AS^OOAAC COC^^IGAS A3AA7IGCIX? 650 
YNVT TKS DTN PK.E KCR 
IML LLNQ TLT PNE RSAA 
.CY Y.I RH.P QMR EVP 

CTOTAACTOC AGODCXSASftG 'I'lUUXlaATC 'l i'iULJimur C^7ICA3XC 700 
CNC SPRV WRS LVS QSGQ 
VTA ARE FGDL WYL SQA 
L.LQ PES LAI FGIS.VRP 

AA3«IAGGA TCACMC?^ QGAAftGAfiCA A:naraCfiG QCClGSaX: ISO 

Q.D DNR GKNN SHR PAG 
NNRM TTE ERT TPTG QQA 
TIG .QQR KEQ LPQ ASRQ 

A^llUXIfiGT GIMftCDCIC ATIGQSKaC AGftMCASAA CftlQSAGftfrT 800 
SSQC RPS LGH RIRT WRL 
VPS VDPH WDT ESE HGDW 
FPV .TL IGTQ NQN MEI 

QOIGCrACAA KKrrVGClk AJnULUIUL* TUSitaSCr GAQGMMCr 850 
VPQ TFAN LRA RRT EEN. 
CHK HLL TCVL EGL RKT 
GATN IC. LAC .RD. 6KL 

MGMGAAX CT^OGTWraSl CICAA^ 900 

EEA YEL LNDV KYN TGK 
RKKP HNY SMM STIT Q6K 
GRS L.IT Q.C PL. HRER 

GGAA2AAAAT CTIS^luuiT TICIGa^C?VS XnA^03?!G GCS^TIQ^OGA 950 
GRKS YCF SGQ TKGG lEE 
EEN LTAF LD'R LRE ALRK 
KRI LLL FWTO .GR H.G 

MMWXIC CXTOICMCT GfiCTCIAnG AA39XAACr AAUCi'liAAKS 1000 
AYL PVT. LY. RPTNLKG 
HTS LSP DSIE GQL ILK 
SIPP CHL TLL KAN. S.R 
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GMWorm ac?cicft3ic McrocMftc attasaaaaa AnmcAAAflG loso 

.VY HSV SCRH .KK LQK 
DKFI TQS AAD IRKN FKS 
ISL SLSQ LOT UEK TSKV 

'iUlUUCri ift S^GOOJOGAQCA GA^OTAGftA AXVmi'l'iA ALri'lCJJLAIC 1100 
SALG PEQ NLE TL F N LAS 
LP. ARSR T.K PYL TWHP 
CLR PGA ELRN PI. LGI 

CICftGrmr TMAAEAGAG AlCMGWaSA GCAG30GW\A 0393ACAAAC 1150 
SVF YNRD QBE QAK RDKR 
QFF IIE IRRS RRN GTN 
LSFL . .R SGG AGET GQT 

G3GATAAAAA AAAAA3QGGG GGTItrftCTRC TTTftGICAro QOCXHCAGCX: 1200 

DKK KRG GPLL .SW PSG 
GIKK KGG VHY FSHG PQA 
G.K KKGG STT LVM ALRQ 

AAGa^3?dT T3GAGQCICT GCAAAft33GA AAftGCI03GC AAAIICAAAro 1250 
KQTL EAL QKG KAGQ IKC 
SRL WRLC KRE KLG KSNA 
ADF GGS AKGK SWA NQM 

anAMMQG ClUjLTlUCA GIGOSGTCIA O^MSRCaCT mAAAAftGA 1300 
LIG LASS AVY KDT LKKI 
.,G WLP VRST RTL .KR 
PNRA GFQ CGL QGHF KKD 

TraroCAMT AGAAM3MC CULXULX-Tm TCCMGCDOC TIM3ICAA3 1350 

IQV EIS RPLV HAP YVK 
LSK. K.A APL SMPL TSR 
YPS RNKP PPC PCP LRQG 

QGAKiaCIG GRMaxnC roXCOmS CSmSAftGMA CTCIGftGICA 1400 
GITG RPT APG DEDT LSQ 
ESL EGPL PQG MKI L.VR 
N H W K A H C P R G . R Y S E S 

GAW30C3OTA P£XXKK3^ OCMCRGCftG G?O(a03G?r QCIXJOGOrG 1450 
KPL TR.S SSR TEG ARGE 
SH. PDD PAAG LRV PGA 
EAIN QMI QQQ D.GC PGR 

PCOXCPOCC CATOCXMOV 0CCT3O3A GCamaGTA TCmXMCA 1500 

RQP MPS PSQS PGY V.P 
SASP CHH PHR APGM FDH 
APA HAIT LTE PRV CLTI 
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BEST AVAILABLE IMAGES 

Defective images within this document are accurate representations of the original 
documents submitted by the appUcant. 

Defects in the images include but are not limited to the items checked: 

"^BLACK BORDERS 

□ IMAGE CUT OFF AT TOP, BOTTOM OR SIDES 
JADED TEXT OR DRAWING 

SLURRED OR ILLEGIBLE TEXT OR DRAWING 
-^^SKEWED/SLANTED IMAGES 

□ COLOR OR BLACK AND WHITE PHOTOGRAPHS 

□ GRAY SCALE DOCUMENTS 

□ LINES OR MARKS ON ORIGINAL DOCUMENT 

□ REFERENCE(S) OR EXHIBIT(S) SUBMITTED ARE POOR QUALITY 

□ OTHER: 

IMAGES ARE BEST AVAILABLE COPY. 
As rescanning these documents wUI not correct the image 
problems checked, please do not report these problems to 
the IFW Image Problem Mailbox. 




